你方唱罷我登場(chǎng)。
過(guò)去一周,國(guó)產(chǎn)AI大模型賽道熱鬧非凡。先是阿里巴巴旗下超大規(guī)模語(yǔ)言模型“通義千問(wèn)”開放內(nèi)測(cè),后有商湯科技、昆侖萬(wàn)維放出自家打造的大模型成果。與此同時(shí),科大訊飛、騰訊、360、字節(jié)跳動(dòng)等也在“摩拳擦掌”,紛紛將發(fā)展人工智能列為未來(lái)企業(yè)的核心戰(zhàn)略……
國(guó)內(nèi)科技企業(yè)圍繞AI大模型上演“百團(tuán)大戰(zhàn)”背后,誰(shuí)能憑硬實(shí)力拔得頭籌?這一新興技術(shù),究竟是虛火過(guò)旺還是星辰大海?
南方日?qǐng)?bào)記者?許雋?葉丹?郜小平
國(guó)產(chǎn)大模型“百舸爭(zhēng)流”
AI大模型,指的是擁有數(shù)百萬(wàn)以上參數(shù)規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型。這類模型在經(jīng)過(guò)專門的訓(xùn)練后,即可對(duì)海量數(shù)據(jù)進(jìn)行復(fù)雜處理和任務(wù)處理。由海外科技公司OpenAI開發(fā)的ChatGPT之所以擁有強(qiáng)大的對(duì)話交互能力,背靠的正是名為“GPT”的AI預(yù)訓(xùn)練模型。
今年以來(lái),隨著ChatGPT爆紅“出圈”,“大模型熱潮”也從國(guó)外涌向了國(guó)內(nèi)。
4月7日,阿里巴巴正式發(fā)布超大規(guī)模語(yǔ)言模型“通義千問(wèn)”,并定向邀請(qǐng)用戶測(cè)試體驗(yàn)。與百度于3月中旬上線的“文心一言”大模型工具類似,“通義千問(wèn)”也具備與用戶進(jìn)行多輪對(duì)話的能力,并支持代碼編程、文案創(chuàng)作等功能。
雖然沒(méi)趕上國(guó)內(nèi)大模型產(chǎn)品的“首發(fā)”,但是“通義千問(wèn)”卻可能是最早通過(guò)各個(gè)場(chǎng)景應(yīng)用融入人們生活的一個(gè)。據(jù)阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇透露,釘釘、天貓精靈將于不久后正式接入該模型,未來(lái)阿里巴巴全系產(chǎn)品都將用上。
4月9日,360宣布,將基于360GPT大模型開發(fā)人工智能產(chǎn)品矩陣“360智腦”,未來(lái)將其率先落地在“360搜索”場(chǎng)景,后續(xù)面向電商、營(yíng)銷、辦公等場(chǎng)景深度落地。
4月10日,商湯科技公布“日日新SenseNova”大模型體系雛形,并現(xiàn)場(chǎng)演示了該模型體系下“商量SenseChat”語(yǔ)言工具的超長(zhǎng)文本閱讀理解、健康咨詢等創(chuàng)新能力。同日,游戲起家的昆侖萬(wàn)維也對(duì)外預(yù)告,不日將發(fā)布和奇點(diǎn)智源合作自研的大模型成果——“天工”3.5,并宣稱這是“中國(guó)第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國(guó)產(chǎn)大語(yǔ)言模型”。
京東、科大訊飛、騰訊、字節(jié)跳動(dòng)打造的大模型產(chǎn)品也有望在未來(lái)一個(gè)月集中亮相。
除此之外,由美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場(chǎng)創(chuàng)始人李開復(fù)、搜狗創(chuàng)始人王小川等企業(yè)高管領(lǐng)銜的“AI大模型創(chuàng)業(yè)軍團(tuán)”,也對(duì)AI大模型風(fēng)口“虎視眈眈”。
“當(dāng)前AI大模型仍是新興技術(shù),未來(lái)的競(jìng)爭(zhēng)格局在一定程度上取決于各廠商的舉措、戰(zhàn)略方向與資本投資方向?!盜DC中國(guó)助理研究總監(jiān)盧言霞指出,目前AI大模型處于百花齊放的狀態(tài),未來(lái)企業(yè)要想真正跑贏對(duì)手,不能僅靠“一頭熱”,而是需要培養(yǎng)自身在數(shù)據(jù)、場(chǎng)景、軟硬一體算力等方面的多重能力。
大廠上演AI“軍備競(jìng)賽”
“每年5000萬(wàn)到1億美元的花費(fèi),是千億級(jí)大模型訓(xùn)練的入場(chǎng)券。”昆侖萬(wàn)維CEO方漢指出,AI大模型高昂的訓(xùn)練成本和研發(fā)投入,讓眾多入局者“望而生畏”。而據(jù)公開資料顯示,無(wú)論是百度、阿里巴巴買還是騰訊、華為每年在研發(fā)上投入的資金均在百億元規(guī)模,研發(fā)團(tuán)隊(duì)人數(shù)破萬(wàn),且在技術(shù)研發(fā)上實(shí)力雄厚,是目前當(dāng)之無(wú)愧的“第一梯隊(duì)”玩家。
以華為為例,身處“制裁常態(tài)化”壓力之下,2022年企業(yè)研發(fā)投入仍高達(dá)1615億元,占總營(yíng)收的25.1%,現(xiàn)金流表現(xiàn)整體健康。在AI大模型相關(guān)的技術(shù)積累上,華為擁有芯片、算力、模型、算法等完善的生態(tài)鏈布局。早在2019至2020年間,公司內(nèi)部就已啟動(dòng)“盤古大模型”立項(xiàng),該模型在預(yù)訓(xùn)練階段累計(jì)學(xué)習(xí)了40TB大小的文本資料,參數(shù)規(guī)模達(dá)千億級(jí)別,目前在工業(yè)、制造、金融、醫(yī)藥等行業(yè)場(chǎng)景都已有成熟的應(yīng)用案例。
百度在人工智能領(lǐng)域布局已有近10年時(shí)間,是國(guó)內(nèi)少數(shù)在芯片層、框架層、模型層、應(yīng)用層有全棧布局的科技企業(yè)。同樣早在2019年,公司就已打造文心大模型ERNIE?1.0。經(jīng)過(guò)多輪迭代,目前模型已經(jīng)升級(jí)到3.0版本。除在模型框架內(nèi)的基礎(chǔ)訓(xùn)練外,ERNIE3.0每天還要接收數(shù)十億用戶的搜索請(qǐng)求,這為“文心一言”積累了豐富的語(yǔ)料庫(kù)。
相較之下,阿里巴巴與騰訊在大模型方面雖然沒(méi)能搶占“頭啖湯”,但是基于原有業(yè)務(wù)、資源和技術(shù)的積累,他們卻是最有機(jī)會(huì)推動(dòng)模型技術(shù)向C端用戶普及的兩家。在業(yè)內(nèi)人士看來(lái),深厚的算力積累和豐富的應(yīng)用場(chǎng)景,都是阿里和騰訊的最大“法寶”。
以阿里巴巴為例,張勇曾經(jīng)指出,大模型是一場(chǎng)“AI云計(jì)算”的全方位競(jìng)爭(zhēng)。超萬(wàn)億參數(shù)的大模型研發(fā),并不僅僅涉及算法問(wèn)題,更囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程,需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。而阿里云從2019年就開始投入大模型研發(fā),算力優(yōu)勢(shì)突出,是全球首個(gè)完成10萬(wàn)億參數(shù)AI大模型訓(xùn)練的企業(yè)。
騰訊方面雖然還沒(méi)有發(fā)布通用的AI大模型工具,但企業(yè)自身不乏在網(wǎng)絡(luò)、存儲(chǔ)、軟件優(yōu)化、訓(xùn)練框架和芯片等大模型技術(shù)上的積累,距離打造一款成熟產(chǎn)品只有“一步之遙”。
而從各自的特有優(yōu)勢(shì)來(lái)看,百度擁有“搜索”這一核心流量入口,有利于第一時(shí)間搶占用戶心智;阿里、騰訊各自擁有釘釘、天貓精靈,微信/QQ等豐富的應(yīng)用生態(tài),能夠推動(dòng)廣泛的場(chǎng)景落地;華為大模型成果在B端已有成熟落地,有望率先在垂直細(xì)分領(lǐng)域做出成績(jī)。
“直道沖鋒”任重而道遠(yuǎn)
浙商證券指出,大模型越來(lái)越成為當(dāng)下科技企業(yè)核心競(jìng)爭(zhēng)力的重要體現(xiàn)。與“元宇宙”等概念不同,大模型有著相對(duì)清晰的商業(yè)模式和應(yīng)用場(chǎng)景。目前,業(yè)內(nèi)也已基本形成共識(shí):大模型將成為AIGC(即AI生成內(nèi)容的生產(chǎn)方式)時(shí)代的核心支撐。
“中國(guó)需要有自己的AI大模型,這是彰顯科技創(chuàng)新實(shí)力的需要,也是經(jīng)濟(jì)和社會(huì)發(fā)展的需要。”互聯(lián)網(wǎng)分析師易方寒告訴南方日?qǐng)?bào)記者,以語(yǔ)言大模型為代表的大模型,作為實(shí)現(xiàn)通用人工智能的關(guān)鍵路徑之一,將成為國(guó)內(nèi)外科技企業(yè)競(jìng)逐的主賽道。
然而,在推動(dòng)國(guó)產(chǎn)AI大模型發(fā)展的過(guò)程中,人才儲(chǔ)備不足、算法和模型質(zhì)量不高、算力存在短板等問(wèn)題,仍然是擺在百度、阿里巴巴等科技企業(yè)面前的難題。
以算法和模型質(zhì)量不高為例。經(jīng)與ChatGPT對(duì)比,百度“文心一言”、阿里巴巴“通義千問(wèn)”等模型在邏輯思辨、復(fù)雜數(shù)理計(jì)算上仍有不小的提升空間。此外,在中文語(yǔ)料庫(kù)方面,據(jù)深圳數(shù)據(jù)交易所董事長(zhǎng)李紅光指出,我國(guó)還面臨數(shù)據(jù)分散,導(dǎo)致數(shù)據(jù)支撐不足的問(wèn)題。
“數(shù)據(jù)分散在不同的地方,碎片化比較嚴(yán)重,也比較封閉,同時(shí),沒(méi)有經(jīng)過(guò)整理的數(shù)據(jù),存在字段缺失、信息不準(zhǔn)等問(wèn)題,目前國(guó)內(nèi)數(shù)據(jù)流通中存在供給不足的問(wèn)題,尤其是高質(zhì)量的數(shù)據(jù)供給不足,限制了國(guó)內(nèi)AI大模型的發(fā)展?!崩罴t光分析,數(shù)據(jù)資源變成數(shù)據(jù)要素,關(guān)鍵點(diǎn)就是數(shù)據(jù)治理,原始數(shù)據(jù)經(jīng)過(guò)治理升級(jí)后才會(huì)成為人工智能領(lǐng)域的支撐。這也正是數(shù)據(jù)交易所存在的價(jià)值——給國(guó)內(nèi)AI大模型的發(fā)展提供數(shù)據(jù)“養(yǎng)分”。
能耗方面也有挑戰(zhàn)。在中興通訊執(zhí)行副總裁、首席運(yùn)營(yíng)官謝峻石看來(lái),大模型的高速發(fā)展,也意味著巨大的能耗——有數(shù)據(jù)顯示,ChatGPT的總算力消耗約為3640PF-days,需要7-8個(gè)投資規(guī)模30億元、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。如何降低訓(xùn)練大模型的成本和能耗?能否通過(guò)自研AI加速芯片降低推理成本?這同樣需要業(yè)界共同思考并解決。
此外,生成式AI也帶來(lái)了一系列隱患,包括國(guó)家安全、虛假內(nèi)容、數(shù)據(jù)泄露、侵權(quán)風(fēng)險(xiǎn)、失業(yè)風(fēng)險(xiǎn)、濫用風(fēng)險(xiǎn)等。對(duì)此,西南政法大學(xué)數(shù)字法治政府研究院研究員鄭志峰認(rèn)為,我國(guó)需要構(gòu)建一套涵蓋研發(fā)、利用全過(guò)程、全要素的監(jiān)管機(jī)制,劃清技術(shù)紅線,確保技術(shù)向善。
“中國(guó)認(rèn)知智能大模型的發(fā)展不僅要‘彎道超車’,還需要‘直道沖鋒’?!笨拼笥嶏w副總裁、研究院院長(zhǎng)劉聰指出,我國(guó)豐富的互聯(lián)網(wǎng)應(yīng)用生態(tài),為國(guó)產(chǎn)AI大模型的落地提供了肥沃的土壤。此外,在垂直類別或多模態(tài)的大模型領(lǐng)域,我國(guó)也存在“彎道超車”的機(jī)會(huì)。
盡管如此,要想對(duì)標(biāo)目標(biāo)并保持差距不斷縮小,我國(guó)仍然需要在芯片、高質(zhì)量數(shù)據(jù)、系統(tǒng)迭代等方面“正面擊破”?!拔覀円暡罹?#xff0c;并且以最先進(jìn)水平為目標(biāo)奮起直追?!?/p>
相關(guān)稿件