7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議在上海開(kāi)幕,深圳計(jì)算科學(xué)研究院首席科學(xué)家樊文飛院士應(yīng)邀出席,在中信集團(tuán)承辦的投融資主題論壇發(fā)表了“AI=機(jī)器學(xué)習(xí)+邏輯推理”的主旨演講,和與會(huì)嘉賓分享了AI領(lǐng)域前沿趨勢(shì)和在垂直領(lǐng)域應(yīng)用的重大機(jī)遇。
大模型——挑戰(zhàn)與機(jī)遇并存
樊文飛院士指出,通用大模型推動(dòng)了行業(yè)的變革,引起社會(huì)的廣泛關(guān)注,但也存在局限性。做為輔助工具,大模型表現(xiàn)優(yōu)異;但在智能制造的應(yīng)用前景還有待觀察。當(dāng)下的大語(yǔ)言模型是基于統(tǒng)計(jì)類(lèi)的機(jī)器學(xué)習(xí)模型,無(wú)法滿(mǎn)足結(jié)果的可解釋,且無(wú)法同時(shí)滿(mǎn)足模型的“準(zhǔn)確性”“公平性”和“魯棒性”要求,邏輯推理能力不強(qiáng),訓(xùn)練成本高(算力、數(shù)據(jù)、能耗),而且經(jīng)常產(chǎn)生“幻覺(jué)” (hallucination)。可否應(yīng)用大模型在生產(chǎn)關(guān)鍵環(huán)節(jié)做出實(shí)時(shí)“決策”,解決行業(yè)痛點(diǎn),提高生產(chǎn)效率?如何確保大模型在智能制造決策中的準(zhǔn)確性和可靠性?如何減少它們所產(chǎn)生的幻覺(jué)?能否增強(qiáng)機(jī)器學(xué)習(xí)的邏輯推理能力?所以要討論大模型的遠(yuǎn)景,首先要確定大模型的定位,不能企望大模型做到其所不能。
如何在工業(yè)界發(fā)揮人工智能的效能,解決行業(yè)痛點(diǎn),是業(yè)界需要關(guān)注和解決的一項(xiàng)重大機(jī)遇和挑戰(zhàn)。在解決行業(yè)痛點(diǎn)問(wèn)題時(shí),大模型是否最優(yōu)解?能否找到成本低、高精度、易解釋的方法,為行業(yè)痛點(diǎn)提供實(shí)時(shí)解決方案?
以“AI+”的自動(dòng)化、高精度、可解釋、低成本賦能工業(yè)界
在人工智能技術(shù)的發(fā)展大潮中,中國(guó)應(yīng)發(fā)揮在制造業(yè)規(guī)模大、垂直領(lǐng)域數(shù)據(jù)積累多等優(yōu)勢(shì)。樊文飛院士提出:以“機(jī)器學(xué)習(xí)+邏輯推理”的“AI+”發(fā)展思路,在提高模型結(jié)果準(zhǔn)確度的同時(shí)賦予結(jié)果可解釋性;與此同時(shí),通過(guò)邏輯規(guī)則融入行業(yè)(小)模型預(yù)測(cè),大幅降低模型的落地成本。深算院通過(guò)獨(dú)創(chuàng)的機(jī)器學(xué)習(xí)模型與業(yè)務(wù)邏輯規(guī)則的高效結(jié)合,研發(fā)填補(bǔ)國(guó)際空白的釣魚(yú)城數(shù)據(jù)分析系統(tǒng),并衍生出生產(chǎn)工藝、配方優(yōu)化、網(wǎng)絡(luò)安全、新藥研發(fā)、金融風(fēng)控、精準(zhǔn)推薦等行業(yè)的AI應(yīng)用創(chuàng)新,均已上線(xiàn)應(yīng)用。如在動(dòng)力電池制造行業(yè),助力頭部企業(yè)在保證誤差率0.06%-0.01%的同時(shí),縮短80%化成分容生產(chǎn)周期,降低50%能耗,單條產(chǎn)線(xiàn)節(jié)省上千萬(wàn)設(shè)備成本,每GWh產(chǎn)能年節(jié)省上百萬(wàn)元電費(fèi),并可擴(kuò)展優(yōu)化更多工藝環(huán)節(jié)。釣魚(yú)城系統(tǒng)已證明可以實(shí)現(xiàn)實(shí)時(shí)決策、精準(zhǔn)解釋、自動(dòng)適配,并在算力不足、訓(xùn)練樣本較少的情況下,得到遠(yuǎn)超大模型的精度,解決許多行業(yè)痛點(diǎn)。
語(yǔ)料準(zhǔn)備與算力同等重要
樊文飛院士表示,目前社會(huì)廣泛聚焦的是大模型以及與其相關(guān)的算力,忽視了大模型訓(xùn)練必需的語(yǔ)料準(zhǔn)備這一關(guān)鍵環(huán)節(jié)。大模型的精度和可用性取決于所訓(xùn)練的語(yǔ)料數(shù)據(jù),如果致力于打造一個(gè)具備產(chǎn)線(xiàn)實(shí)時(shí)應(yīng)用的大模型決策系統(tǒng),那么語(yǔ)料清洗的重要性和算力同等重要?;凇按髷?shù)據(jù)質(zhì)量保證模型與方法”原創(chuàng)理論,深算院研發(fā)的采石磯數(shù)據(jù)質(zhì)量系統(tǒng),為上海數(shù)據(jù)交易所的數(shù)據(jù)評(píng)估和數(shù)據(jù)交易流程提供底層能力支撐,落地國(guó)內(nèi)首創(chuàng)的大數(shù)據(jù)精準(zhǔn)量化質(zhì)量評(píng)估,實(shí)現(xiàn)了自動(dòng)化的數(shù)據(jù)質(zhì)量評(píng)估和數(shù)據(jù)質(zhì)量增強(qiáng),真正打通數(shù)據(jù)要素進(jìn)入流通的關(guān)鍵節(jié)點(diǎn)。下一步將繼續(xù)為大模型的訓(xùn)練提供優(yōu)質(zhì)的語(yǔ)料數(shù)據(jù)和行業(yè)調(diào)優(yōu)數(shù)據(jù),以提升行業(yè)大模型的準(zhǔn)確性。
走出國(guó)產(chǎn)基礎(chǔ)軟件的“寒冬”
重要性不亞于大模型的是標(biāo)準(zhǔn)化基礎(chǔ)軟件的研發(fā)。目前芯片受制于人。如果開(kāi)源軟件被禁用,中國(guó)的大模型發(fā)展將何去何從?所以堅(jiān)持自主源頭創(chuàng)新和自研根技術(shù),才能推動(dòng)中國(guó)軟件行業(yè)真正走出受制于人的困境。例如,深算院以有界計(jì)算、跨模計(jì)算等創(chuàng)新理論,研發(fā)出全自研滿(mǎn)足AI場(chǎng)景需求的崖山數(shù)據(jù)庫(kù)系統(tǒng),實(shí)現(xiàn)與國(guó)際主流數(shù)據(jù)庫(kù)在高端場(chǎng)景提供1:1的平替能力,在中國(guó)人民銀行數(shù)字貨幣場(chǎng)景,通過(guò)反復(fù)數(shù)十萬(wàn)次的故障和高可用測(cè)試,故障恢復(fù)和數(shù)據(jù)一致性得到強(qiáng)保證,在兼容、功能、故障、運(yùn)維、備份、安全、性能等維度,滿(mǎn)足數(shù)字貨幣場(chǎng)景對(duì)數(shù)據(jù)庫(kù)的業(yè)務(wù)訴求。
相關(guān)稿件