大廠競逐AI大模型虛火過旺還是星辰大海？: 2023-04-14 10:45 來源：南方日?qǐng)?bào) 次閱讀; 分享：
微信扫一扫：分享
微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈。

你方唱罷我登場。

　　過去一周，國產(chǎn)AI大模型賽道熱鬧非凡。先是阿里巴巴旗下超大規(guī)模語言模型“通義千問”開放內(nèi)測，后有商湯科技、昆侖萬維放出自家打造的大模型成果。與此同時(shí)，科大訊飛、騰訊、360、字節(jié)跳動(dòng)等也在“摩拳擦掌”，紛紛將發(fā)展人工智能列為未來企業(yè)的核心戰(zhàn)略……

　　國內(nèi)科技企業(yè)圍繞AI大模型上演“百團(tuán)大戰(zhàn)”背后，誰能憑硬實(shí)力拔得頭籌？這一新興技術(shù)，究竟是虛火過旺還是星辰大海？

　　南方日?qǐng)?bào)記者?許雋?葉丹?郜小平

　　國產(chǎn)大模型“百舸爭流”

　　AI大模型，指的是擁有數(shù)百萬以上參數(shù)規(guī)模的深度神經(jīng)網(wǎng)絡(luò)模型。這類模型在經(jīng)過專門的訓(xùn)練后，即可對(duì)海量數(shù)據(jù)進(jìn)行復(fù)雜處理和任務(wù)處理。由海外科技公司OpenAI開發(fā)的ChatGPT之所以擁有強(qiáng)大的對(duì)話交互能力，背靠的正是名為“GPT”的AI預(yù)訓(xùn)練模型。

　　今年以來，隨著ChatGPT爆紅“出圈”，“大模型熱潮”也從國外涌向了國內(nèi)。

　　4月7日，阿里巴巴正式發(fā)布超大規(guī)模語言模型“通義千問”，并定向邀請(qǐng)用戶測試體驗(yàn)。與百度于3月中旬上線的“文心一言”大模型工具類似，“通義千問”也具備與用戶進(jìn)行多輪對(duì)話的能力，并支持代碼編程、文案創(chuàng)作等功能。

　　雖然沒趕上國內(nèi)大模型產(chǎn)品的“首發(fā)”，但是“通義千問”卻可能是最早通過各個(gè)場景應(yīng)用融入人們生活的一個(gè)。據(jù)阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇透露，釘釘、天貓精靈將于不久后正式接入該模型，未來阿里巴巴全系產(chǎn)品都將用上。

　　4月9日，360宣布，將基于360GPT大模型開發(fā)人工智能產(chǎn)品矩陣“360智腦”，未來將其率先落地在“360搜索”場景，后續(xù)面向電商、營銷、辦公等場景深度落地。

　　4月10日，商湯科技公布“日日新SenseNova”大模型體系雛形，并現(xiàn)場演示了該模型體系下“商量SenseChat”語言工具的超長文本閱讀理解、健康咨詢等創(chuàng)新能力。同日，游戲起家的昆侖萬維也對(duì)外預(yù)告，不日將發(fā)布和奇點(diǎn)智源合作自研的大模型成果——“天工”3.5，并宣稱這是“中國第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型”。

　　京東、科大訊飛、騰訊、字節(jié)跳動(dòng)打造的大模型產(chǎn)品也有望在未來一個(gè)月集中亮相。

　　除此之外，由美團(tuán)聯(lián)合創(chuàng)始人王慧文、創(chuàng)新工場創(chuàng)始人李開復(fù)、搜狗創(chuàng)始人王小川等企業(yè)高管領(lǐng)銜的“AI大模型創(chuàng)業(yè)軍團(tuán)”，也對(duì)AI大模型風(fēng)口“虎視眈眈”。

　　“當(dāng)前AI大模型仍是新興技術(shù)，未來的競爭格局在一定程度上取決于各廠商的舉措、戰(zhàn)略方向與資本投資方向?！盜DC中國助理研究總監(jiān)盧言霞指出，目前AI大模型處于百花齊放的狀態(tài)，未來企業(yè)要想真正跑贏對(duì)手，不能僅靠“一頭熱”，而是需要培養(yǎng)自身在數(shù)據(jù)、場景、軟硬一體算力等方面的多重能力。

　　大廠上演AI“軍備競賽”

　　“每年5000萬到1億美元的花費(fèi)，是千億級(jí)大模型訓(xùn)練的入場券?！崩鋈f維CEO方漢指出，AI大模型高昂的訓(xùn)練成本和研發(fā)投入，讓眾多入局者“望而生畏”。而據(jù)公開資料顯示，無論是百度、阿里巴巴買還是騰訊、華為每年在研發(fā)上投入的資金均在百億元規(guī)模，研發(fā)團(tuán)隊(duì)人數(shù)破萬，且在技術(shù)研發(fā)上實(shí)力雄厚，是目前當(dāng)之無愧的“第一梯隊(duì)”玩家。

　　以華為為例，身處“制裁常態(tài)化”壓力之下，2022年企業(yè)研發(fā)投入仍高達(dá)1615億元，占總營收的25.1%，現(xiàn)金流表現(xiàn)整體健康。在AI大模型相關(guān)的技術(shù)積累上，華為擁有芯片、算力、模型、算法等完善的生態(tài)鏈布局。早在2019至2020年間，公司內(nèi)部就已啟動(dòng)“盤古大模型”立項(xiàng)，該模型在預(yù)訓(xùn)練階段累計(jì)學(xué)習(xí)了40TB大小的文本資料，參數(shù)規(guī)模達(dá)千億級(jí)別，目前在工業(yè)、制造、金融、醫(yī)藥等行業(yè)場景都已有成熟的應(yīng)用案例。

　　百度在人工智能領(lǐng)域布局已有近10年時(shí)間，是國內(nèi)少數(shù)在芯片層、框架層、模型層、應(yīng)用層有全棧布局的科技企業(yè)。同樣早在2019年，公司就已打造文心大模型ERNIE?1.0。經(jīng)過多輪迭代，目前模型已經(jīng)升級(jí)到3.0版本。除在模型框架內(nèi)的基礎(chǔ)訓(xùn)練外，ERNIE3.0每天還要接收數(shù)十億用戶的搜索請(qǐng)求，這為“文心一言”積累了豐富的語料庫。

　　相較之下，阿里巴巴與騰訊在大模型方面雖然沒能搶占“頭啖湯”，但是基于原有業(yè)務(wù)、資源和技術(shù)的積累，他們卻是最有機(jī)會(huì)推動(dòng)模型技術(shù)向C端用戶普及的兩家。在業(yè)內(nèi)人士看來，深厚的算力積累和豐富的應(yīng)用場景，都是阿里和騰訊的最大“法寶”。

　　以阿里巴巴為例，張勇曾經(jīng)指出，大模型是一場“AI云計(jì)算”的全方位競爭。超萬億參數(shù)的大模型研發(fā)，并不僅僅涉及算法問題，更囊括了底層龐大算力、網(wǎng)絡(luò)、大數(shù)據(jù)、機(jī)器學(xué)習(xí)等諸多領(lǐng)域的復(fù)雜系統(tǒng)性工程，需要有超大規(guī)模AI基礎(chǔ)設(shè)施的支撐。而阿里云從2019年就開始投入大模型研發(fā)，算力優(yōu)勢突出，是全球首個(gè)完成10萬億參數(shù)AI大模型訓(xùn)練的企業(yè)。

　　騰訊方面雖然還沒有發(fā)布通用的AI大模型工具，但企業(yè)自身不乏在網(wǎng)絡(luò)、存儲(chǔ)、軟件優(yōu)化、訓(xùn)練框架和芯片等大模型技術(shù)上的積累，距離打造一款成熟產(chǎn)品只有“一步之遙”。

　　而從各自的特有優(yōu)勢來看，百度擁有“搜索”這一核心流量入口，有利于第一時(shí)間搶占用戶心智；阿里、騰訊各自擁有釘釘、天貓精靈，微信/QQ等豐富的應(yīng)用生態(tài)，能夠推動(dòng)廣泛的場景落地；華為大模型成果在B端已有成熟落地，有望率先在垂直細(xì)分領(lǐng)域做出成績。

　　“直道沖鋒”任重而道遠(yuǎn)

　　浙商證券指出，大模型越來越成為當(dāng)下科技企業(yè)核心競爭力的重要體現(xiàn)。與“元宇宙”等概念不同，大模型有著相對(duì)清晰的商業(yè)模式和應(yīng)用場景。目前，業(yè)內(nèi)也已基本形成共識(shí)：大模型將成為AIGC（即AI生成內(nèi)容的生產(chǎn)方式）時(shí)代的核心支撐。

　　“中國需要有自己的AI大模型，這是彰顯科技創(chuàng)新實(shí)力的需要，也是經(jīng)濟(jì)和社會(huì)發(fā)展的需要。”互聯(lián)網(wǎng)分析師易方寒告訴南方日?qǐng)?bào)記者，以語言大模型為代表的大模型，作為實(shí)現(xiàn)通用人工智能的關(guān)鍵路徑之一，將成為國內(nèi)外科技企業(yè)競逐的主賽道。

　　然而，在推動(dòng)國產(chǎn)AI大模型發(fā)展的過程中，人才儲(chǔ)備不足、算法和模型質(zhì)量不高、算力存在短板等問題，仍然是擺在百度、阿里巴巴等科技企業(yè)面前的難題。

　　以算法和模型質(zhì)量不高為例。經(jīng)與ChatGPT對(duì)比，百度“文心一言”、阿里巴巴“通義千問”等模型在邏輯思辨、復(fù)雜數(shù)理計(jì)算上仍有不小的提升空間。此外，在中文語料庫方面，據(jù)深圳數(shù)據(jù)交易所董事長李紅光指出，我國還面臨數(shù)據(jù)分散，導(dǎo)致數(shù)據(jù)支撐不足的問題。

　　“數(shù)據(jù)分散在不同的地方，碎片化比較嚴(yán)重，也比較封閉，同時(shí)，沒有經(jīng)過整理的數(shù)據(jù)，存在字段缺失、信息不準(zhǔn)等問題，目前國內(nèi)數(shù)據(jù)流通中存在供給不足的問題，尤其是高質(zhì)量的數(shù)據(jù)供給不足，限制了國內(nèi)AI大模型的發(fā)展?！崩罴t光分析，數(shù)據(jù)資源變成數(shù)據(jù)要素，關(guān)鍵點(diǎn)就是數(shù)據(jù)治理，原始數(shù)據(jù)經(jīng)過治理升級(jí)后才會(huì)成為人工智能領(lǐng)域的支撐。這也正是數(shù)據(jù)交易所存在的價(jià)值——給國內(nèi)AI大模型的發(fā)展提供數(shù)據(jù)“養(yǎng)分”。

　　能耗方面也有挑戰(zhàn)。在中興通訊執(zhí)行副總裁、首席運(yùn)營官謝峻石看來，大模型的高速發(fā)展，也意味著巨大的能耗——有數(shù)據(jù)顯示，ChatGPT的總算力消耗約為3640PF-days，需要7-8個(gè)投資規(guī)模30億元、算力500P的數(shù)據(jù)中心才能支撐運(yùn)行。如何降低訓(xùn)練大模型的成本和能耗？能否通過自研AI加速芯片降低推理成本？這同樣需要業(yè)界共同思考并解決。

　　此外，生成式AI也帶來了一系列隱患，包括國家安全、虛假內(nèi)容、數(shù)據(jù)泄露、侵權(quán)風(fēng)險(xiǎn)、失業(yè)風(fēng)險(xiǎn)、濫用風(fēng)險(xiǎn)等。對(duì)此，西南政法大學(xué)數(shù)字法治政府研究院研究員鄭志峰認(rèn)為，我國需要構(gòu)建一套涵蓋研發(fā)、利用全過程、全要素的監(jiān)管機(jī)制，劃清技術(shù)紅線，確保技術(shù)向善。

　　“中國認(rèn)知智能大模型的發(fā)展不僅要‘彎道超車’，還需要‘直道沖鋒’。”科大訊飛副總裁、研究院院長劉聰指出，我國豐富的互聯(lián)網(wǎng)應(yīng)用生態(tài)，為國產(chǎn)AI大模型的落地提供了肥沃的土壤。此外，在垂直類別或多模態(tài)的大模型領(lǐng)域，我國也存在“彎道超車”的機(jī)會(huì)。

　　盡管如此，要想對(duì)標(biāo)目標(biāo)并保持差距不斷縮小，我國仍然需要在芯片、高質(zhì)量數(shù)據(jù)、系統(tǒng)迭代等方面“正面擊破”?！拔覀円暡罹?#xff0c;并且以最先進(jìn)水平為目標(biāo)奮起直追?！?/p>

點(diǎn)贊()

上一條：投教數(shù)字化轉(zhuǎn)型：投資者教育的內(nèi)容陪伴和營銷形式研究｜貝塔數(shù)據(jù)研究院2023-04-14

下一條：一季度外貿(mào)“開門穩(wěn)” 競爭新優(yōu)勢積聚2023-04-14