百度股價(jià)三天連漲了12.8%??淳W(wǎng)上評(píng)論和分析,應(yīng)該是與上周(3月16日)發(fā)布了被稱為“中國(guó)版ChatGPT”生成式對(duì)話產(chǎn)品“文心一言”有關(guān)。
隨著美國(guó)OpenAI研發(fā)的聊天機(jī)器人程序ChatGPT的推出,最近一個(gè)時(shí)期,有關(guān)ChatGPT和AI是網(wǎng)上、微信群討論的熱門話題。我歸納了一下,討論的主題主要集中在兩個(gè)方面,一是AI未來會(huì)如何發(fā)展,將會(huì)給人類的未來帶來什么?二是中國(guó)與美國(guó)在這方面有多大差距,差距是如何造成的,何時(shí)能夠趕上?很多人為此感到焦急和憂慮,有些“恨鐵不成鋼”的情緒。百度比較及時(shí)地推出“文心一言”,客觀上是對(duì)這種焦慮情緒的回應(yīng),應(yīng)該能夠在一定程度上緩解這種焦慮情緒。
從現(xiàn)場(chǎng)演示來看,“文心一言”在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等方面的能力比較突出?!拔男囊谎浴币劳杏诎俣人阉鳂I(yè)務(wù)所積累的海量的知識(shí)圖譜,在上述幾個(gè)方面做得比較好應(yīng)該是順理成章的。據(jù)介紹,“文心一言”大模型的訓(xùn)練數(shù)據(jù)包括萬億級(jí)網(wǎng)頁數(shù)據(jù)、數(shù)十億搜索數(shù)據(jù)和圖片數(shù)據(jù)、百億級(jí)語音日均調(diào)用數(shù)據(jù)及5500億事實(shí)的知識(shí)圖譜,因此其在中文語言的處理上,具有獨(dú)特的優(yōu)勢(shì)。而且,據(jù)說數(shù)據(jù)規(guī)模大,參數(shù)達(dá)到千億級(jí),大模型就可能發(fā)生“智能涌現(xiàn)”,涌現(xiàn)出知識(shí)和邏輯推理能力。此外,百度的數(shù)據(jù)形態(tài)也最貼合回答和生成需求。在百度搜索中,問答和生成類的搜索請(qǐng)求占比很高。這些,都為“文心一言”在自然語言問答和創(chuàng)意內(nèi)容生成上提供了很好的條件。
也有網(wǎng)友指出“文心一言”對(duì)有些問題回答得不夠好。我的理解是目前“文心一言”還有些“偏科”。要它在各個(gè)方面都做得好,還需要進(jìn)行不斷訓(xùn)練。我們相信它會(huì)不斷一進(jìn)步,很可能會(huì)進(jìn)步很快。
值得肯定的是,在全球各大廠中,類似的AI產(chǎn)品,百度是第一個(gè)做出來的。這類大型的語言模型,需要多年的研發(fā),不斷地改進(jìn),不是短期內(nèi)靠突擊能做出來的。特別是深度學(xué)習(xí)、自然語言處理,需要多年的堅(jiān)持和積累,沒法速成。
在類似OpenAIChatGPT和百度“文心一言”這樣的領(lǐng)域,硬件的限制少,主要是軟件的能力,應(yīng)該說基本上沒有“卡脖子”的問題。我們國(guó)家在這方面應(yīng)該是有優(yōu)勢(shì)的。百度有很好的基礎(chǔ),又有很好的政策、市場(chǎng)、人才方面的優(yōu)勢(shì),達(dá)到世界先進(jìn)水平應(yīng)該是很有希望的。我們拭目以待。
(作者系作者上海交大上海高級(jí)金融學(xué)院教授陳欣)
相關(guān)稿件