AI大模型會變傻嗎?
這事或正在發(fā)生!
頂級科學(xué)期刊《自然》發(fā)表的最新研究給似乎將變得無所不能的大模型判了“死緩”,將這種糟糕情況描述為“大模型崩潰”。
《自然》雜志最新一期封面,圖源:Nature
除了變傻,大模型還面臨發(fā)展路線分歧。一條傾向于把通用大模型做到盡可能完善,然后自上而下實現(xiàn)產(chǎn)業(yè)、商業(yè)場景全覆蓋;一條則是扎根產(chǎn)業(yè),從實際應(yīng)用中自下而上催生成熟的產(chǎn)業(yè)大模型,為通用大模型的完善積累“智慧”。
有意思的是,根據(jù)《全球數(shù)字經(jīng)濟白皮書(2024)》統(tǒng)計,目前全球的基礎(chǔ)大模型有1328個,美國最多,中國第二。而產(chǎn)業(yè)大模型,中國表現(xiàn)了極大的熱忱。更有意思的是,美國企業(yè)多傾向第一條路線,而中國開發(fā)者則越來越扎堆第二條路線。很難說兩條路線誰更具優(yōu)勢。不過對《自然》的最新警告,很可能不會出現(xiàn)在走第二條路線的中國開發(fā)者身上。
人們期待AI大模型引領(lǐng)人類開啟新紀元的愿望有多熱切,“大模型崩潰”帶來的打擊就有多強烈。
下一次大模型泡沫說不定就是被它引爆的。這種事在互聯(lián)網(wǎng)與資本的蜜月期也屢見不鮮。
如果訓(xùn)練大模型時,只用AI生成的內(nèi)容,會導(dǎo)致大模型出現(xiàn)不可逆的缺陷。一些在第一代數(shù)據(jù)中出現(xiàn)的低頻詞,在以后的迭代中出現(xiàn)的頻率會更低,而一些常見詞匯出現(xiàn)的頻率則逐漸增加。久而久之,模型逐漸無法正確模擬真實世界的復(fù)雜性。錯誤被層層累積、逐漸放大,最終導(dǎo)致“模型崩潰”。
很像生物學(xué)中“近親繁殖”導(dǎo)致后代缺陷的過程。
如何規(guī)避“模型崩潰”陷阱,讓大模型更好的成長呢?
接地氣是選擇之一。事實上,許多中國大模型開發(fā)者就是這么做的。
比如京東推出的言犀大模型,以及基于大模型產(chǎn)生的京醫(yī)千詢、京點點、小哥智能終端助手等一系列智能體應(yīng)用。
截至目前,京東大模型落地超過100個場景,支持了23萬+商家,2萬+京東采銷,1萬+研發(fā)人員;不但涵蓋零售、供應(yīng)鏈等核心領(lǐng)域,還能兼顧辦公自動化、法務(wù)、風(fēng)控、合同審核、數(shù)據(jù)分析的解決方案,并拓展到了健康領(lǐng)域。
京東大模型開發(fā)最大特色就是從實踐中來到實踐中去,大模型在京東基本實現(xiàn)了祛魅,即使是普通的業(yè)務(wù)人員都能自己定制、拿來就用。
能用、好用的大模型,緣于京東對供應(yīng)鏈的深耕。
回溯歷史,供應(yīng)鏈可謂歷次產(chǎn)業(yè)革命的集大成者。諸多巨型企業(yè)、經(jīng)濟學(xué)家、管理學(xué)家、還有產(chǎn)業(yè)研究者早早就把供應(yīng)鏈整體協(xié)同優(yōu)化,視為企業(yè)更上層樓的關(guān)鍵。
舉個簡單的例子,一輛汽車的零部件通常超過3萬件,核心工廠很難生產(chǎn)全部零部件,會把大部分零部件交給上下游企業(yè)生產(chǎn)。但汽車裝配對零部件供貨時間要求極高,協(xié)同不好就會影響交貨。
所以,最早的產(chǎn)業(yè)互聯(lián)網(wǎng)就是由美國汽車四巨頭聯(lián)手締造。
而京東產(chǎn)業(yè)大模型的橫空出世,似乎有一點歷史宿命的意味。
供應(yīng)鏈是產(chǎn)業(yè)中數(shù)據(jù)最集中、協(xié)同最復(fù)雜的場景,通過數(shù)據(jù)實現(xiàn)管理優(yōu)化即可提升供應(yīng)鏈效率,通過落地大模型能夠快速釋放供應(yīng)鏈效能,相比其它場景能最快發(fā)揮智能的優(yōu)勢。
京東有一個公式,大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。第四個乘數(shù),正好呼應(yīng)了我們前文中提到的第二條路線的特質(zhì),能極大彌補AI生成數(shù)據(jù)的先天不足,從而為大模型的成長提供了一個更平衡、更全面的路徑。
圖源:數(shù)字基礎(chǔ)設(shè)施技術(shù)趨勢白皮書(2023)
大模型誕生到現(xiàn)在,人們早已不再滿足于其強大的自然語言(含圖形)理解、語言生成和語音識別等能力,在聊天、娛樂等通識屬性較強的場景上的表現(xiàn),更寄希望于實際用起來產(chǎn)業(yè)落地,商業(yè)落地。
正如中國工程院院士鄔賀銓所說的:對話、寫詩、作畫絕不是大模型的全部。我們需要將大模型切實投入到城市發(fā)展、金融科技、生物醫(yī)藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,也需要專業(yè)的企業(yè)和組織加速其在實體產(chǎn)業(yè)落地,為產(chǎn)業(yè)剛需帶來實實在在的價值,真正意義大規(guī)模服務(wù)社會。
京東就走在這條路上。京東集團技術(shù)委員會主席、京東云事業(yè)部總裁曹鵬認為“通用大模型靠算力堆出來,企業(yè)大模型靠業(yè)務(wù)跑出來”, 并表示“京東供應(yīng)鏈是大模型應(yīng)用的超級孵化器?!?/p>
2024京東云峰會上,京東云展示了京東言犀大模型落地行業(yè)的領(lǐng)先技術(shù)與最新實踐,并重磅發(fā)布京東云企業(yè)大模型服務(wù)、言犀智能體平臺、智能編程助手JoyCoder、言犀數(shù)字人3.0等八大產(chǎn)品。
當(dāng)大模型遇上供應(yīng)鏈,產(chǎn)業(yè)互聯(lián)網(wǎng)的歷史一幕也許會在京東身上重現(xiàn)?
京東言犀大模型的成長,還能讓我們可以對世界工廠的全面刷新暢想一番。
中國擁有聯(lián)合國工業(yè)名錄門類劃分中的39個大類、191個中類、525個小類的全部門類。構(gòu)成這個龐大工業(yè)體系的是40萬家企業(yè),其中超過90%的企業(yè)是中小微企業(yè)。
圖源:鈦媒體
都知道數(shù)智化是方向,但常規(guī)的研發(fā)者不會去鉆研不同產(chǎn)業(yè)的技術(shù)訣竅,以至于基礎(chǔ)大模型讓很多中小企業(yè)覺得高不可攀,彼此之間誰仿佛都覺得對方離自己還遠著呢。
京東云為產(chǎn)業(yè)締造了一個全新的關(guān)鍵容易上手的系統(tǒng),還是相對繁雜偏偏還離不開的供應(yīng)鏈方面。
從生產(chǎn)到流通,從原料供應(yīng)、倉儲,到運輸、分銷,以及最終的消費者,傳統(tǒng)供應(yīng)鏈的節(jié)點繁復(fù),交織成的網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,流通環(huán)節(jié)也總是層層障礙。
京東云本身就扎根于供應(yīng)鏈,加上之前的積淀,在零售、物流、倉儲、金融、健康、工業(yè)等產(chǎn)業(yè)擁有深入實踐,還參與了城市、政務(wù)、金融、制造、工業(yè)、航空、交通、園區(qū)、能源等產(chǎn)業(yè)。
京東云很多年前就確定了數(shù)智供應(yīng)鏈的目標(biāo)。其核心理念是產(chǎn)業(yè)聯(lián)結(jié)、數(shù)智創(chuàng)新和生態(tài)融合,通過數(shù)智供應(yīng)鏈建設(shè),企業(yè)能夠從產(chǎn)業(yè)鏈全局優(yōu)化效率,以數(shù)智技術(shù)驅(qū)動數(shù)實融合,同時聯(lián)結(jié)更多生態(tài)伙伴,實現(xiàn)更高效的數(shù)字化轉(zhuǎn)型。
大模型的落地,讓數(shù)智供應(yīng)鏈再次蛻變,線性鏈條連接“孤島”,交織成一個復(fù)雜網(wǎng)絡(luò),進而實現(xiàn)有限的自主呼應(yīng),有點類似藤曼纏繞的雨林結(jié)構(gòu),如今這個系統(tǒng)又有了高級統(tǒng)御的智慧。
AI智能體(AI Agent)被視為過往技術(shù)發(fā)展的集大成者,在工業(yè)界已得到共識,能夠廣泛適配各類應(yīng)用場景。AI智能體以大型語言模型(LLM)作為核心控制器構(gòu)建,可以構(gòu)建出強大的問題解決器。
言犀智能體平臺
京東云言犀智能體平臺是新一代一站式 AI Agent 開發(fā)平臺,目前已接入數(shù)十個大模型,它幾乎就是一個為使用而生的平臺。無論用戶是否有編程基礎(chǔ),從解決簡單的問答到處理復(fù)雜邏輯的業(yè)務(wù)問題,都可以在平臺上低成本快速搭建基于 AI 模型的各類快捷應(yīng)用。
比如外貿(mào)供應(yīng)鏈的報關(guān)場景,會產(chǎn)生大量報關(guān)碼(HS code),需要人工尋找到每個code,還要手動輸入商品描述。京東云言犀智能體平臺通過workflow反向RAG,描繪商品,找到對應(yīng)code。另外還有智能體低代碼開發(fā)的應(yīng)用構(gòu)件,輸入一段描述的自然語言,就可以基于Agent生成應(yīng)用。
還有外貿(mào)中的訂單履約場景,過去需要通過客服問詢,京東云通過言犀智能體平臺調(diào)用API,就能查到訂單履約到哪了;通過Agent調(diào)用對應(yīng)的foundation,就能查到物流訂單到哪了。而且拆單狀態(tài)、履約情況、合同審核等場景在國際貿(mào)易時不能只用中文,還需要多種語言,基于AgentAIG就能輕松實現(xiàn)多語言問答。
通用大模型要做到這一步,往往會出現(xiàn)開發(fā)冗余、貨不對板或者成本高企,而針對性強的產(chǎn)業(yè)大模型卻能夠同時對齊了成本、效率、體驗三方面要求。
對業(yè)務(wù)場景的理解與觸達,對產(chǎn)業(yè)數(shù)據(jù)的積淀與運用,是京東言犀大模型保持精度的重要前提。實際上,言犀大模型數(shù)據(jù)就是由70%的通用數(shù)據(jù)與30%供應(yīng)鏈場景生長的原生數(shù)據(jù)構(gòu)成。
你能想象京東的小哥都在自如實現(xiàn)與大模型的對接嗎?
多場景智能助手 特定角色提供專業(yè)服務(wù)
小哥的崗前培訓(xùn),比如具體到服務(wù)過程中如何處理異常?哪些違禁品不能郵寄?以及耗材等問題……
過去他們需要記住大量專業(yè)知識,過程長,還容易出錯,現(xiàn)在京東云基于言犀大模型為小哥量身訂制了終端智能助手,這位“助手”能牢記從攬收、派送、站內(nèi)、輔助、客戶服務(wù)等143項標(biāo)準作業(yè)動作,到貨物處理規(guī)程、安全操作標(biāo)準、KA客戶等915個服務(wù)要求都能回答。
對于物流、派送地址等常規(guī)操作,小哥甚至只需要動動嘴,小哥助手就能優(yōu)化流程,給出優(yōu)化方案。
如今物流的小哥終端智能助手已服務(wù)近35萬京東自有配送員。
京東集團副總裁何曉冬將這比作培養(yǎng)一個人,“如果一個人高中畢業(yè)后直接出去打工,似乎也行,但專業(yè)性會差一點。要是能讀完四年本科再出去工作,就既有通識能力又有足夠的專業(yè)知識,這是產(chǎn)業(yè)大模型應(yīng)該具備的能力”。
至此,京東供應(yīng)鏈與大模型,形成了一對奇特耦合且螺旋上升關(guān)系:一方面,大模型的出現(xiàn)為供應(yīng)鏈的深化、優(yōu)化、數(shù)智化提供了新的增長點;另一方面,京東供應(yīng)鏈的復(fù)雜場景產(chǎn)生的真實數(shù)據(jù)可以訓(xùn)練大模型,讓大模型在供應(yīng)鏈上先跑起來;進而,不斷成長的大模型又將賦能供應(yīng)鏈,激發(fā)更大的改變。
這種結(jié)構(gòu)像極了DNA,不斷延伸延展,孕育無限可能。也在述說著,更適合企業(yè)的大模型真的可以一邊跑一邊訓(xùn)出來。
DNA結(jié)構(gòu),圖源:University of Minnesota Libraries
種一棵樹最好的時間是十年前,其次是現(xiàn)在。
京東云對大模型深耕落地產(chǎn)業(yè)的理解,不是種樹,而是種森林。
這種“森林思維”很契合大模型的養(yǎng)成。
以往我們發(fā)展大模型,尤其是通用大模型,缺芯片導(dǎo)致算力不足,算法也有差距也就罷了,連原本應(yīng)該最豐富的數(shù)據(jù),也因為數(shù)據(jù)標(biāo)準化等諸多問題,而變得無法用于大模型的訓(xùn)練。
甚為可惜。
不過,京東云做產(chǎn)業(yè)大模型的歷程展示了一條因地制宜的發(fā)展國產(chǎn)大模型的新的路徑。
和生產(chǎn)場景無限接近,加上互聯(lián)網(wǎng)企業(yè)的基因,讓京東云在特定的領(lǐng)域積累了大量優(yōu)質(zhì)的數(shù)據(jù),這些數(shù)據(jù)對于產(chǎn)業(yè)、垂類大模型是再優(yōu)質(zhì)不過的養(yǎng)料。
多年以前,面對復(fù)雜的消費和零售價值鏈,劉強東將每個環(huán)節(jié)總結(jié)成“十節(jié)甘蔗”,隨后京東選擇滲透進入更多的甘蔗節(jié)數(shù)——將業(yè)務(wù)延伸至倉儲、配送、售后、營銷之外的生產(chǎn)、研發(fā)等供應(yīng)鏈其他環(huán)節(jié)。
如今吃透每個環(huán)節(jié),讓京東的產(chǎn)業(yè)大模型在應(yīng)對具體的場景時就仿佛含著金鑰匙出生。
中國企業(yè)有望證實大模型第二條商業(yè)路徑的合理性。
如今,全球通用大模型競爭白熱化,對高端GPU的追求,堆爆了英偉達的股價,讓其一度超越蘋果、微軟,登頂全球最大市值企業(yè),也同時讓大多數(shù)渴望大模型引發(fā)傳統(tǒng)產(chǎn)業(yè)嬗變的企業(yè)開始望洋興嘆。
因為它們既不好用,更加用不起。
國際通行的評判大模型的標(biāo)準是算力、算法、數(shù)據(jù)。以京東云為代表的一部分中國企業(yè)則以自己與產(chǎn)業(yè)的高度融合,提出了大模型產(chǎn)業(yè)落地“新三要素”:場景、產(chǎn)品、算力。
復(fù)雜的交互智能場景及其產(chǎn)生的動態(tài)數(shù)據(jù)、從單一算法競爭到形成可以牽引成體系算法創(chuàng)新與突破的產(chǎn)品和能支撐這樣的場景與系統(tǒng)的新型算力。
基本理念是基座大模型靠堆卡訓(xùn)練,企業(yè)大模型靠人用出來。
本次2024京東云峰會,京東云發(fā)布三大智能平臺、五大領(lǐng)先技術(shù)產(chǎn)品,從基礎(chǔ)設(shè)施到Agent應(yīng)用,構(gòu)建全場景的大模型服務(wù)能力,持續(xù)推動大模型落地產(chǎn)業(yè):
· 京東云企業(yè)大模型服務(wù),支持一站式打造企業(yè)專屬大模型,將垂直領(lǐng)域知識注入到模型的同時,不損失模型的通用能力,且更加經(jīng)濟適用;
· 言犀AI開發(fā)計算平臺2.0,內(nèi)置20余種開源模型和豐富的數(shù)據(jù)集,提供100余種算法和工具鏈,提供低門檻、高性價比的大模型開發(fā)服務(wù);
· 京東云大模型安全可信平臺,涵蓋超過200種特有的紅藍對抗攻擊手法,覆蓋監(jiān)管合規(guī)要求的全部31類風(fēng)險類型,風(fēng)險分析準確率高達95%以上;
· 京東云云艦AI算力云,支持多地域分布式算力的統(tǒng)一調(diào)度,提供高性價比的算力供給;
· 新一代分布式存儲云海3.0,支持千億級參數(shù)AI大模型,4K隨機寫IOPS達到1000萬級,平均延遲在100微秒級,極致性能更好地支持大模型落地應(yīng)用。
真正適合企業(yè)的越來越多的大模型應(yīng)用,正在京東供應(yīng)鏈上生長出來。在內(nèi)部業(yè)務(wù)中根據(jù)實際需求找到大模型落地的場景后,京東云已能對外輸出能力。
今年京東618期間,京東云言犀數(shù)字人在5000+品牌穩(wěn)定開播,在汽車、跨境美妝、珠寶首飾、3C數(shù)碼、家電家居、醫(yī)療健康等多品類播間帶動閑時轉(zhuǎn)化率提升超30%,直播累計時長超40萬小時,累計觀看人次超1億,互動頻次500萬+次。
京東云言犀數(shù)字人依托全新升級的3.0版本,以超100個性化角色、超50行業(yè)特定屬性場景,表現(xiàn)超過行業(yè)80%的主播。除電商直播場景外,言犀數(shù)字人還在文旅、金融、智能服務(wù)、政務(wù)咨詢等更廣泛的場景應(yīng)用落地,與億級用戶智能交互,帶來下一代交互體驗。
健康大模型京醫(yī)千詢成為基于行業(yè)內(nèi)首個實物與服務(wù)相聯(lián)通、知識與數(shù)據(jù)相融合的醫(yī)療大模型。免費智能醫(yī)生“康康”結(jié)合京東健康億級醫(yī)患會話和豐富的實物、服務(wù)、內(nèi)容等供應(yīng)鏈資源,提供專業(yè)咨詢服務(wù);專屬個人醫(yī)助支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病歷等功能,全流程輔助醫(yī)生提升問診效率。如今京東健康皮膚醫(yī)院基于大模型的AI輔診準確率超過95%。
“道生一,一生二,二生三,三生萬物?!薄兜赖陆?jīng)》認為天地萬物的始基與母源在于“道”。在供應(yīng)鏈和大模型的“宇宙”中,京東云尋到了“道”。
2017年京東戰(zhàn)略會上,劉強東高喊“技術(shù)、技術(shù)、技術(shù)”的戰(zhàn)略。7年過去了,京東云在大模型產(chǎn)業(yè)應(yīng)用實踐中,成為這家企業(yè)戰(zhàn)略遠見與定力的力證。
什么是新質(zhì)生產(chǎn)力?
什么是最優(yōu)的產(chǎn)業(yè)轉(zhuǎn)型升級路徑?
在新技術(shù)激蕩的時代,其實就是用新技術(shù)把你熟悉的一切從頭到腳重新做一遍。
當(dāng)大模型落地離我們越來越近,京東云再次選擇把大模型做實,把供應(yīng)鏈做透。
其實腳踏實地,與仰望星空并不沖突。京東云能讓大模型與有史以來最龐大的世界工廠的融合得多一點,更順滑一點,那樣的情景都足以令人心潮澎湃。
相關(guān)稿件