5月10日消息,近期中國(guó)移動(dòng)研究院發(fā)布《我國(guó)人工智能大模型發(fā)展動(dòng)態(tài)》報(bào)告,對(duì)國(guó)內(nèi)涉足人工智能大模型訓(xùn)練的多家企業(yè)及科研院所進(jìn)行評(píng)估。中國(guó)移動(dòng)研究院認(rèn)為,從大模型業(yè)界評(píng)估看,國(guó)內(nèi)大模型與GPT-4有差距,但科技大廠具備追趕實(shí)力,百度、阿里巴巴、騰訊、華為等在大模型研發(fā)投入、技術(shù)能力和人才團(tuán)隊(duì)等綜合實(shí)力較強(qiáng);在商用推進(jìn)方面,依托現(xiàn)有業(yè)務(wù)領(lǐng)域形成大模型應(yīng)用規(guī)模效應(yīng)。
報(bào)告指出,國(guó)內(nèi)大模型研發(fā)應(yīng)用領(lǐng)域熱潮持續(xù)高漲。據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)至少有19家企業(yè)及科研院所涉足人工智能大模型訓(xùn)練,主要分為大型科技公司、科研院校和初創(chuàng)科技團(tuán)隊(duì)三類(lèi)。
從大模型的布局體系來(lái)看,百度、阿里、華為等大型科技公司從算力層、平臺(tái)層、模型層、應(yīng)用層進(jìn)行了全面布局,科研院及初創(chuàng)科技公司主要以研發(fā)大模型算法及細(xì)分領(lǐng)域應(yīng)用為主。以百度為例,百度“昆侖芯+飛槳平臺(tái)+文心大模型+行業(yè)應(yīng)用”在芯片層、框架層、模型層和應(yīng)用層布局最完整。四層架構(gòu)之間能形成層到層的反饋、端到端的優(yōu)化,尤其是框架層的飛槳和模型層的文心大模型。最新數(shù)據(jù)顯示,飛槳與文心一言協(xié)同專(zhuān)項(xiàng)優(yōu)化在一個(gè)月內(nèi)迭代4次,推理性能提升10倍,其中分布式推理引擎推理性能提升了123%。阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應(yīng)用”、華為的“昇騰芯片+MindSpore框架+盤(pán)古大模型+行業(yè)應(yīng)用”也是多層布局。
報(bào)告認(rèn)為,從大模型參數(shù)量看,大型科技公司的參數(shù)量遠(yuǎn)大于科研院所,但基本都處于千億及以上規(guī)模,而科研院校大模型的參數(shù)量在千億級(jí)及以下。公開(kāi)資料顯示,2019年,百度發(fā)布文心大模型ERNIE,目前已迭代至千億級(jí)參數(shù)的ERNIE3.0Zeus。2023年3月起,百度相繼發(fā)布了知識(shí)增強(qiáng)大語(yǔ)言模型產(chǎn)品“文心一言”和一站式企業(yè)級(jí)大模型生產(chǎn)平臺(tái)“文心千帆大模型平臺(tái)”。
報(bào)告數(shù)據(jù)顯示,從綜合實(shí)力和商用推進(jìn)方面,百度文心大模型和文心一言均領(lǐng)先,處于第一梯隊(duì)頭部。在商用推進(jìn)方面,百度文心大模型拓展內(nèi)外部應(yīng)用,目前面向公眾和企業(yè)用戶(hù)同時(shí)進(jìn)行開(kāi)放測(cè)試。文心大模型在金融、能源、制造、城市、傳媒、互聯(lián)網(wǎng)等行業(yè)應(yīng)用案例落地廣泛。截至目前,已經(jīng)有15萬(wàn)企業(yè)申請(qǐng)加入文心一言?xún)?nèi)測(cè),覆蓋政務(wù)、金融、媒體、電商零售等行業(yè)。
另?yè)?jù),國(guó)際權(quán)威咨詢(xún)機(jī)構(gòu)IDC在今年2月發(fā)布的《2022中國(guó)大模型發(fā)展白皮書(shū)》中,提出了行業(yè)首個(gè)大模型評(píng)估框架,根據(jù)評(píng)估結(jié)果,百度文心大模型在市場(chǎng)格局中同樣處于第一梯隊(duì)領(lǐng)先位置,產(chǎn)品能力、生態(tài)能力、應(yīng)用能力均受到廣泛認(rèn)可。
相關(guān)稿件