近日,圍繞火爆全網(wǎng)的ChatGPT話題,聯(lián)想集團(tuán)CTO、高級(jí)副總裁芮勇博士接受了《中國計(jì)算機(jī)學(xué)會(huì)通訊》(CCCF)的專訪,并分享了對(duì)ChatGPT等大模型的看法。芮勇表示,聯(lián)想新IT架構(gòu)將在AI新范式加速智能化變革的過程中繼續(xù)發(fā)揮重要作用。除了基礎(chǔ)架構(gòu)之外,聯(lián)想還在考慮AIGC技術(shù)在產(chǎn)品和業(yè)務(wù)里的應(yīng)用。
從大模型到AGI還有多遠(yuǎn)?
ChatGPT是OpenAI GPT系列中為對(duì)話場景優(yōu)化的語言模型,屬于Foundation Models,即基礎(chǔ)模型,簡稱為“大模型”。芮勇將它的特點(diǎn)概括為“一大三多”:一大是指參數(shù)規(guī)模大,是千億參數(shù)級(jí)別的超大型人工智能模型;三多是指利用多來源、多模態(tài)、多任務(wù)的互聯(lián)網(wǎng)規(guī)模海量數(shù)據(jù)進(jìn)行訓(xùn)練。
芮勇認(rèn)為,大模型首先在內(nèi)容理解領(lǐng)域大獲成功,例如BERT問世時(shí)刷新了11項(xiàng)自然語言理解任務(wù)的記錄,最近又在內(nèi)容生成領(lǐng)域取得了矚目成就,也就是AIGC。
對(duì)于外界普遍關(guān)心的大模型是否催生了AI新范式,芮勇給出的答案是,簡單來講,AI范式的轉(zhuǎn)變,是從“針對(duì)特定任務(wù),更新預(yù)訓(xùn)練模型”(small models + fine-tuning)轉(zhuǎn)換到“根據(jù)上下文提示自動(dòng)理解并執(zhí)行各類任務(wù),無需更新模型參數(shù)或架構(gòu)”(large models + in-context learning)。
ChatGPT的成功,讓業(yè)界看到了由大模型通往AGI (通用人工智能) 的曙光,不過,芮勇認(rèn)為,大模型能走多遠(yuǎn),前景到底如何,是否能實(shí)現(xiàn)“多任務(wù),多模態(tài),多化身的大一統(tǒng)”,目前還頗有爭議。
他進(jìn)一步解釋,近幾年大模型有了突破式進(jìn)展,很多人持樂觀態(tài)度。從Gartner技術(shù)成熟度曲線可以看到,大模型目前處于“期望膨脹階段”(Peak of Inflated Expectations) 。人們對(duì)它的期望很高,但也應(yīng)該看到,大模型尚未解決的問題還很多。比如谷歌版的ChatGPT,取名Bard,首次公開展示就出現(xiàn)回答結(jié)果不準(zhǔn)確的問題,導(dǎo)致公司市值一天之內(nèi)蒸發(fā)超1000億美元。此外,對(duì)話機(jī)器人生成句子里包含的信息無法溯源,甚至包含偏向性和冒犯性言論等等??梢?#xff0c;通往AGI的道路還很漫長。
聯(lián)想在大模型普及中發(fā)揮怎樣的作用?
大模型的興起,為進(jìn)行智能化變革的企業(yè)帶來了很多新的機(jī)遇。芮勇以聯(lián)想為例進(jìn)行了介紹。聯(lián)想借鑒大模型背后的基礎(chǔ)性算法,將小樣本學(xué)習(xí)應(yīng)用到基于計(jì)算機(jī)視覺的產(chǎn)品缺陷檢測當(dāng)中,提升了質(zhì)檢系統(tǒng)對(duì)新產(chǎn)品和新產(chǎn)線的快速遷移能力;此外,聯(lián)想還將強(qiáng)化學(xué)習(xí)技術(shù)和人機(jī)協(xié)作的理念應(yīng)用到供應(yīng)鏈優(yōu)化當(dāng)中,使得供應(yīng)鏈在劇烈變化的環(huán)境中,不斷提升韌性。
對(duì)于聯(lián)想將在AI新范式和大模型普及中發(fā)揮怎樣的作用,芮勇表示,長遠(yuǎn)來看,很有可能AI新范式(large models + in-context learning)與舊范式(small models + fine-tune)共存,或是相互結(jié)合,而不會(huì)單個(gè)范式一統(tǒng)天下。聯(lián)想將充分發(fā)揮“端-邊-云-網(wǎng)-智”新IT架構(gòu)的優(yōu)勢,來支撐新舊范式的結(jié)合與轉(zhuǎn)換。聯(lián)想提出的新IT架構(gòu),既致力于推動(dòng)自身的智能化變革,也著眼于賦能各行各業(yè)的智能化轉(zhuǎn)型。AI模型對(duì)運(yùn)行環(huán)境需求越來越高,例如云-邊-端的高度協(xié)同,異構(gòu)計(jì)算與負(fù)載均衡、設(shè)備之間的互聯(lián)互通、數(shù)據(jù)安全與隱私保護(hù)、模型本身的伸縮性與擴(kuò)展性等等。聯(lián)想在這些方面都有著深厚的技術(shù)積累,新IT架構(gòu)在AI新范式加速智能化變革的過程中也會(huì)繼續(xù)發(fā)揮重要作用。
除了基礎(chǔ)架構(gòu)之外,聯(lián)想還在考慮AIGC技術(shù)在產(chǎn)品和業(yè)務(wù)里的應(yīng)用。比如,在智能設(shè)備中對(duì)跨模態(tài)的生成模型進(jìn)行優(yōu)化和裁剪,使之能加載到手機(jī)或平板上實(shí)現(xiàn)個(gè)性化內(nèi)容生成。在智能解決方案方面,我們考慮把AIGC用于新產(chǎn)品營銷與新客戶觸達(dá)。目前,大模型還沒有與知識(shí)有效結(jié)合,我們正在研究數(shù)據(jù)驅(qū)動(dòng)與知識(shí)驅(qū)動(dòng)相結(jié)合的方法,即Hybrid Learning來改進(jìn)大模型的不足。另外,在大模型落地過程中,也需要徹底解決對(duì)環(huán)境變化或是新領(lǐng)域、新任務(wù)的自適應(yīng)問題,即Adaptive Learning,這些都是聯(lián)想人工智能的探索方向。
相關(guān)稿件