生成式人工智能的火爆出圈,再次引發(fā)全球?qū)θ斯ぶ悄馨l(fā)展的廣泛關(guān)注,更讓人們體會到大模型對人工智能發(fā)展的重要意義。
在5月18日天津舉辦的第七屆世界智能大會上,百度CEO李彥宏發(fā)表了題為《大模型改變?nèi)斯ぶ悄堋返难葜v。李彥宏表示,“我不擔(dān)心大模型會導(dǎo)致人類工作機(jī)會減少。”“人類最大的危險,最大的不可持續(xù),并不是創(chuàng)新帶來的不確定性。相反的,我們停止創(chuàng)新,不發(fā)明不創(chuàng)造不進(jìn)步,按照慣性走下去,所帶來的各種各樣不可預(yù)知的風(fēng)險,才是人類最大的威脅。”
李彥宏認(rèn)為,大數(shù)據(jù)、大算力、大模型,導(dǎo)致了智能涌現(xiàn)。同時,人工智能發(fā)生了方向性改變,從辨別式AI走向生成式AI。大模型還重新定義了人機(jī)交互,重新定義營銷和客服。任何一個公司,誰擁有最佳的跟客戶溝通的方式,誰就會擁有客戶。
百度是全球大廠中,第一個做出對標(biāo)ChatGPT的大模型文心一言的公司。也是全球唯一在人工智能四層架構(gòu),即芯片層、框架層、模型層和應(yīng)用層都有全棧布局的公司。文心大模型,體現(xiàn)了百度在人工智能技術(shù)領(lǐng)域的領(lǐng)先實力。
以下為李彥宏演講實錄:
各位領(lǐng)導(dǎo)、各位嘉賓:我今天給大家?guī)淼念}目叫做《大模型改變?nèi)斯ぶ悄堋?。剛才龔克也講了,人工智能在過去這半年當(dāng)中,受到的關(guān)注度比以前高了很多,最主要的是因為出現(xiàn)了生成式的人工智能。而生成式人工智能底層技術(shù),實際上就是大模型。
那么大模型為什么會改變?nèi)斯ぶ悄苣?#xff1f;是大算力、大模型、大數(shù)據(jù),導(dǎo)致了智能涌現(xiàn),什么叫智能涌現(xiàn)呢?過去的人工智能是,我想讓機(jī)器學(xué)會什么技能,就教它什么技能。教過的有可能會,沒教過的就不會。大模型出現(xiàn)所謂的智能涌現(xiàn)之后,以前沒教過的技能,它也會了。這就是為什么有人講,我們現(xiàn)在朝著通用人工智能方向發(fā)展。
與此同時,人工智能發(fā)展方向從辨別式走向生成式。什么叫辨別式?我們過去比較熟悉的人工智能的應(yīng)用,基本上都是辨別式。比如說人臉識別,過來一個人,我識別這個人是誰,或者不是誰。這個是典型的辨別式。搜索引擎也是典型的辨別式人工智能。用戶輸入關(guān)鍵字或者一段話,他要找的東西,我們在全網(wǎng)進(jìn)行匹配,哪一個網(wǎng)頁,哪一段內(nèi)容是他需要的,這是辨別式人工智能。
什么叫生成式人工智能?今天我想寫一份申請書,你給我寫一下。或者說,我周末請客,10個人,需要出一份菜單,這個無所謂對錯,但是它能給你一些感覺,給你一些創(chuàng)意,給你一個好的基礎(chǔ)去發(fā)展你的思路?;蛘哒f,給我畫一幅車水馬龍的圖片。這種東西,過去人們不覺得是人工智能應(yīng)該做的事,現(xiàn)在可以做了。
那么這樣會導(dǎo)致什么呢?導(dǎo)致人們的工作效率大幅度地提升。比如說,在內(nèi)容創(chuàng)作、客戶服務(wù)、翻譯這些工作,它的效率會大幅度地提升。所以我們也看到,很多研究機(jī)構(gòu)都認(rèn)為,在未來的10年,很多工作它的效率會成倍成倍的提升。同時也帶來一些擔(dān)心,是不是這樣的效率提升,會使得很多人的工作就沒了?這些人工作丟掉之后,會不會給我們?nèi)祟悗聿豢深A(yù)知的問題。
其實這個事兒我也講過很久,最好的去探知答案的方法,實際上是回顧過去。因為很多人也覺得,人工智能是第四次產(chǎn)業(yè)革命的標(biāo)志,我們可以看看之前的產(chǎn)業(yè)革命都取代了哪些工作?
200年前,從井下背水的工作基本上消失了。第一次產(chǎn)業(yè)革命是蒸汽機(jī)的發(fā)明,蒸汽機(jī)發(fā)明第一個應(yīng)用就是采礦的水,怎么能夠把它用機(jī)器弄上來。井下背水這些工作的消失,帶來了什么?我們來看一下,實際上產(chǎn)生了很多新的工作。
這100年,我們看到世界人口出現(xiàn)了高速增長,跟之前的一兩千年人口增長速度相比,快了很多。與此同時,人均GDP也幾乎是在同樣地快速增長。這說明什么?說明雖然有些工作機(jī)會沒了,但是更多的機(jī)會出現(xiàn)了。人們工作效率的提升,可以養(yǎng)活更多的人,而每個人的生活又變得比以前更好了。從井下背水那個工作,真的不是什么好工作。
100年前,馬車夫的工作消失了。這張圖片是1913年紐約第五大道的一張圖片,這張圖片里幾乎已經(jīng)全部都是汽車,只有一輛馬車。那會兒,紐約到處都是賣馬肉的,馬也沒用了,后來出現(xiàn)了很多新的工作。1900-1990接近90年,同樣的規(guī)律,世界人口繼續(xù)高速增長,每一個人創(chuàng)造的價值繼續(xù)高速地增長。
30年前,我們這一代人親身經(jīng)歷,也就是我大學(xué)畢業(yè)前后,什么工作消失了?打字員的工作消失了?,F(xiàn)在年輕一代沒有見過打字機(jī)的,但也出現(xiàn)了很多新的工作。同樣的規(guī)律,世界人口繼續(xù)高速增長,人均GDP繼續(xù)高速增長。
歷史雖然不會重復(fù),但是確實有它的規(guī)律。那么這一次,為什么那么多人會擔(dān)心AI會讓工作機(jī)會減少呢?我覺得是因為,大家能夠看到現(xiàn)在的工作會消失,但是我們看不到什么新的工作機(jī)會會被創(chuàng)造出來。就像100年前、200年前那些人,看不到后來產(chǎn)生的新的工作機(jī)會一樣。我個人是屬于樂觀派,我不擔(dān)心大模型會導(dǎo)致人類工作機(jī)會減少、生活會變差。
那么大模型怎么重新定義的人工智能?剛才萬鋼主席也講了,人機(jī)交互的方式發(fā)生了變化。其實過去幾十年信息產(chǎn)業(yè)的發(fā)展,人機(jī)交互的方式發(fā)生了三次變化。
更早我們就不說了,命令行是我讀大學(xué)讀研究生的時候,主要的工作界面。人機(jī)進(jìn)行交互,是通過命令行。我輸入一個命令,它給我想要的反應(yīng)。我當(dāng)時覺得這個東西效率很高,但是大多數(shù)人不會這種操作。
更簡單的人機(jī)交互方式是什么?是圖形用戶界面(GUI)。這個起碼很多人能看懂了,比第一個要更友好一些。但它仍然不是最自然的交互方式。我要想搞清楚怎么重設(shè)一下電腦的自動睡眠時間,我得經(jīng)過四級菜單,一層一層地點(diǎn)進(jìn)去,才能找到這個位置。有多少人能記住四級菜單以后,每一個功能在哪?
人工智能的誕生,讓我們可以用自然語言跟電腦進(jìn)行交互。當(dāng)我有需求的時候,比如說我想查一下上個月,2023年4月,我的公司每一個產(chǎn)品線,有哪些產(chǎn)品的毛利率超過了疫情前的水平?這樣一個課題,在過去很可能需要我的助理花半天一天的時間才能獲得。今天,如果計算機(jī)懂你的自然語言,一秒鐘之內(nèi)就可以給你一個表格。
大模型也會重新定義營銷和客服。其實道理很簡單,就是誰擁有最佳的跟客戶溝通的方式,誰就會擁有這個客戶。這個道理不是因為AI的產(chǎn)生,不是因為大模型的產(chǎn)生,只不過技術(shù)使得我們實現(xiàn)的可能性,變得比以前多了很多。今天即使你有70億個客戶,你的每一個客戶也都可以有一個專屬的7×24小時的、什么都知道的助理去服務(wù)他。
大模型是一個基礎(chǔ),大模型之上會有各種各樣人工智能的應(yīng)用。最近這段時間討論比較熱的是,AI時代的原生應(yīng)用到底長什么樣子?我給大家舉幾個例子:
比如說像DoNotPay,這是什么呢?比較典型的應(yīng)用場景是人工智能律師。比如說,你在美國開車超速了,超速之后警察給你一個罰單,一般交幾百塊錢。其實你可以不交,你請一個律師幫你打官司,就可以不交了。但是請一個律師的錢,可能是罰單錢的兩倍,所以你不請了。今天請AI當(dāng)律師,你就可以不交那個錢。
Jasper是營銷創(chuàng)意的生成工具,你的公司想要出什么樣的創(chuàng)意,它來幫你出,所以效率高很多。
Speak是韓國的軟件應(yīng)用,實際上是教你學(xué)外語的,模擬各種場景,你要到餐館點(diǎn)餐,跟對方談判,你要跟對方怎么交互,上百種語言都可以做得非常好。
對于百度來說,我們的大模型叫文心一言,兩個月之前發(fā)布的,應(yīng)該說是在全球大廠當(dāng)中是第一個發(fā)布的。之所以我們要盡快地發(fā)布出來,是因為市場有非常強(qiáng)的需求。目前有200多萬的用戶在排隊等待進(jìn)行測試,也有十幾萬家企業(yè)希望接入文心一言進(jìn)行測試。
當(dāng)然百度在這方面的投入,實際上不是剛剛開始的,不是這半年才開始的。我們從2019年發(fā)布了文心大模型的1.0,到現(xiàn)在已經(jīng)有四年的時間。更早的時候,我們從2013年左右就開始人工智能投入了。
人工智能之所以有這么大的變化,其實不僅僅是它的應(yīng)用場景的變化,實際上背后的技術(shù)棧也發(fā)生了非常根本的變化。
我們每個人都熟悉的IT的技術(shù)棧是這三層,底層是芯片層,典型的公司是英特爾、AMD、高通,它的芯片叫做CPU;中間層是操作系統(tǒng),在PC時代就是Windows,在手機(jī)時代是安卓和iOS;上面是應(yīng)用層,PC時代所有的人都給Windows開發(fā)軟件,在移動時代所有的人都給安卓和iOS開發(fā)應(yīng)用。
今天人工智能時代的到來,改變了這個格局。現(xiàn)在的IT技術(shù)棧變成了四層,底層仍然是芯片層,但是主要的芯片已經(jīng)不是CPU,而是以GPU為代表的,新一代適合并行大規(guī)模浮點(diǎn)運(yùn)算的芯片。上面我們叫做框架層,就是深度學(xué)習(xí)的框架,像百度的PaddlePaddle飛槳,Meta的PyTorch,谷歌的TensorFlow都是在這一層。再上面一層是模型層,今天的ChatGPT、文心一言等等,這些是屬于模型層,以后AI時代的原生應(yīng)用,都會基于大模型來進(jìn)行開發(fā)。
這方面百度有比較明顯的優(yōu)勢,我們在四層當(dāng)中每一層都有比較領(lǐng)先的產(chǎn)品,比如說芯片層有昆侖芯。這個也做了有十年之久,最早是因為搜索應(yīng)用需要,我們買別人的芯片,畢竟太貴了,所以自己開發(fā)了??蚣軐邮秋w槳,飛槳今天在中國的市場份額第一。在模型層是文心大模型,其實除了文心一言,它是對標(biāo)ChatGPT的之外,我們還有很多行業(yè)大模型,如交通大模型、能源大模型等。應(yīng)用層的話,像百度搜索等都是我們比較領(lǐng)先的應(yīng)用。
這四層都有比較領(lǐng)先的產(chǎn)品或者技術(shù),有什么好處呢?就是你可以進(jìn)行端到端的優(yōu)化,每一層可以給其他層反饋,根據(jù)這些反饋你可以綜合的、統(tǒng)籌的去考慮怎么優(yōu)化。
百度在芯片層的布局,就是昆侖芯,我們已經(jīng)有兩代產(chǎn)品,幾萬片的部署,無論是公司內(nèi)還是公司外都在應(yīng)用。昆侖芯第三代,會在明年年初上市。
在框架層,飛槳的框架在中國人工智能領(lǐng)域已經(jīng)有了500多萬開發(fā)者,也越來越獲得大家的認(rèn)同。
模型層剛才講了文心一言,在各種使用場景都有不少的應(yīng)用。未來,我相信會有更多的應(yīng)用會基于文心大模型開發(fā)出來。
在應(yīng)用層大家比較熟悉的是百度的搜索,百度不可能在應(yīng)用層什么都做,我們除了搜索之外,還做了跟交通有關(guān)的應(yīng)用。交通也是非常復(fù)雜,而且影響非常廣泛的方向。
百度做的其實主要是兩件事,一個是自動駕駛,或者是無人駕駛的技術(shù),一個是智能交通。無人駕駛我們做了有十年時間,現(xiàn)在在武漢、在重慶都可以進(jìn)行商業(yè)化的無人的運(yùn)營。智能交通我們也做了有好幾年了,在不少城市都證明了效果,通過智能的調(diào)整紅綠燈變燈的時間,可以讓我們的城市的交通效率有15%到30%的明顯提升。五一長假之前最后一個工作日,很多人也注意到,北京是大堵車,從二環(huán)到五環(huán),甚至在六環(huán)都是紅的,唯一一片綠的是亦莊,亦莊有智能交通的人工智能系統(tǒng),可以動態(tài)調(diào)整交通流,所以效率確實是被證明有明顯的提升。
我們也很期待未來在大模型之上,會有各行各業(yè)各種應(yīng)用能夠找到好的應(yīng)用場景,能夠獲得效率大幅度的提升。
最后,我想說對于人類來說,最大的危險,最大的不可持續(xù),并不是創(chuàng)新帶來的不確定性。相反的,我們停止創(chuàng)新,不發(fā)明不創(chuàng)造不進(jìn)步,按照慣性走下去,所帶來的各種各樣不可預(yù)知的風(fēng)險,才是人類最大的威脅。這就是為什么,百度在這么多年長期持續(xù)的在人工智能方面進(jìn)行投入,也是我們?yōu)槭裁匆寻俣鹊氖姑?#xff0c;在多年前就定義成“用科技讓復(fù)雜的世界更簡單”。
謝謝!
相關(guān)稿件