大廠需要證明,他們投入的數(shù)十億元甚至數(shù)百億資金并沒有打水漂。
文|《中國企業(yè)家》記者 閆俊文?
與張一鳴熬夜讀論文、王興收購初創(chuàng)公司不同,劉強東帶領京東高管捕捉大模型的方式是在真實場景中不斷嘗試產(chǎn)品和服務。
劉強東在2017年就說過,AI既是一種技術,也是一種思考方式,他甚至暢想過,京東未來將實現(xiàn)無人辦公場景。
技術大變革期,也是公司興衰交替的關鍵期。他不可能無視大模型這種顛覆性技術所產(chǎn)生的影響,京東將如何參與這場游戲呢?
面對這場底層沖擊,各家均有不同的應對方式,對于京東來說,它的實體業(yè)務基因更濃厚,自1998年創(chuàng)立,已從中關村的一張柜臺發(fā)展到如今旗下5家上市公司,還有3家正在尋求上市——京東工業(yè)、京東產(chǎn)發(fā)和京東科技,員工人數(shù)擴張至超56萬,業(yè)務場景比阿里巴巴、騰訊與字節(jié)跳動都要復雜和多元,覆蓋物流、零售、金融、健康、工業(yè)等等。
產(chǎn)業(yè)場景多元以及天然的to B場景,讓京東對大模型服務產(chǎn)業(yè)的渴求更強烈,天然成為了大模型落地產(chǎn)業(yè)最好的“練兵場”。
在京東之前,騰訊、百度以及阿里巴巴都發(fā)布了行業(yè)大模型方案,但一位SaaS行業(yè)人士感慨,只聽到雷聲,不見下雨,暗示這些互聯(lián)網(wǎng)巨頭不會輕而易舉攻下行業(yè)山頭。
京東的雷聲和雨點在哪里?
全集團共建
大模型正在變成京東公共環(huán)境的一部分。它以視頻與海報的形式,出現(xiàn)在總部電梯間電視里、辦公走廊的墻上。
2023年2月份,京東對外宣布將發(fā)布服務產(chǎn)業(yè)的大模型。很快,大模型在京東集團內部也被提升到了更高的優(yōu)先級,并很快成立了大模型項目組,至少已向劉強東匯報過5次。
何曉冬博士是京東探索研究院院長及京東科技智能服務與產(chǎn)品部總裁,也是京東自研“言犀大模型”的核心科學家。他說,以零售為例,人們購物的行為是事件驅動,以“我要買什么”開始,但大模型技術加入后,可能以“我要干什么”開始,這意味著,購物行為包括了小紅書的種草、抖音的內容以及京東的貨架,混合了多種形態(tài)。
內容以及交互的變革不斷驅動新產(chǎn)品以及巨頭公司的興起。從雅虎的衰落到谷歌的崛起,從淘寶再到抖音的崛起,王座權力的轉移總是伴隨著這條鐵律。如今,大模型為代表的AI則重寫這條鐵律。
大模型訓練需要大量的產(chǎn)業(yè)數(shù)據(jù)做預訓練,這些數(shù)據(jù)分布在京東零售、健康、物流、金融等各個產(chǎn)業(yè)線。于是,集團協(xié)調,各個BG(事業(yè)群)和BU(事業(yè)部)都參與大模型項目,最后,大模型項目組的人數(shù)達到了100人左右。
“他們把零售、物流、健康等業(yè)務數(shù)據(jù)帶進來,也會把大模型的功能帶回去用。”何曉冬說。
這構成了京東言犀大模型30%的訓練數(shù)據(jù)來源——京東圍繞著數(shù)智供應鏈積累下的高質量原生數(shù)據(jù),而剩下70%來源于通用數(shù)據(jù)。何曉冬形容這個過程就像對大模型進行高等教育——學習了通用知識后開始在大學學習專業(yè)知識。
行業(yè)數(shù)據(jù)進來了,對數(shù)據(jù)還要做脫敏、分類以及加權處理,比如經(jīng)營、營銷、特有知識的數(shù)據(jù);針對不同行業(yè),不同數(shù)據(jù)的加權系數(shù)是不一樣的,比如金融領域,業(yè)務數(shù)據(jù)權重會多一些,要幫助員工更好地把控風險;零售領域,又分倉儲、商城、社區(qū)團購、到家、超市等業(yè)務單元,不同類型數(shù)據(jù)對細分的業(yè)務場景的重要性也是不同的。
何曉冬強調,要做行業(yè)大模型,企業(yè)必須在這個行業(yè)做到足夠的頭部以及沉浸數(shù)年以上,才能吃透這個行業(yè),了解行業(yè)發(fā)展的痛點。
在基礎設施上,京東云此前就建立了一個1000多張(A100)顯卡的機房,這是他們在2021年購入的,集成了英偉達最先進的計算和連接設備,保障大模型的訓練和迭代。
京東也在同步采用大模型改造內部流程,他們發(fā)起了名為“效能提升”的項目,讓程序員運用大模型產(chǎn)品工具,提升敲代碼、寫注釋以及測試案例的效率。綜合評估下來,業(yè)績平均估計提升20%以上。
在產(chǎn)品層面,除了智能客服,京東開始內部測試言犀大模型在諸多業(yè)務場景中的應用。比如產(chǎn)品搜索與推薦上,電商將很快從“萬事皆搜索”進入到“萬事皆服務” 的時代。
以搜索“帳篷”為例,未來,搜索結果里不僅僅看到帳篷這個產(chǎn)品,更能看到露營上下游配套的產(chǎn)品和服務,比如上游的旅行地推薦,下游的配套“燒烤”“鞋帽”等產(chǎn)品,加入了類似小紅書或者攜程的功能。它還可以自動生成一些文案,用戶露營完之后,可以發(fā)送至朋友圈。
還有金融營銷,通過自動化營銷助手“AI增長營銷平臺”提升營銷活動方案生產(chǎn)效率。這種全新的交互模式,讓人機交互次數(shù)從2000次降低至少于50次,操作效率可提升超過40倍。
何曉冬認為,通過人機多輪溝通,機器能更好地理解用戶的意圖,將意圖轉化為需求。傳統(tǒng)互聯(lián)網(wǎng)領域里有“注意力經(jīng)濟學”理論,它主要靠設計、折扣、廣告等客觀條件來吸引用戶,但在“意圖理解”的場景下,通過多輪對話,用戶自己就會沉浸其中,并產(chǎn)生消費以及內容。
這是一個比當下垂類APP更龐大復雜的形態(tài)。如果搜索時代是信息聚合與匹配,那么大模型的時代則進入了內容精準生成,用戶隨時隨地 “Ask Me Anything(隨便問)”。
打磨毛刺
7月,京東推出言犀大模型之后,并沒有急于推向市場,尋求落地,他們的時間路線圖是今年下半年內部錘煉,并針對重點場景和客戶進行打磨,2024年初對外開放大模型能力。
何曉冬將言犀大模型錘煉的過程稱之為“打磨毛刺”。他以健康問診為例解釋,京東計劃在8月正式上線健康行業(yè)大模型?,F(xiàn)在內部更多是Beta(測試)版本,比如會遇到如何保護病人自尊心的問題,這涉及到溝通的語速、方式,小概率情況下,會測出產(chǎn)品說話不合適的現(xiàn)象。
“技術和產(chǎn)品之間其實是有鴻溝的,產(chǎn)品一定是用戶角度,技術是創(chuàng)新角度?!焙螘远f。技術體系的人一定要往前走一步,主動貼近產(chǎn)品體系的人。
他預測,現(xiàn)在已經(jīng)到了大模型技術要通過產(chǎn)品來證明自己價值的階段。AI技術有點像云業(yè)務一樣,它是提高生產(chǎn)力的,最后必然為各種各樣的行業(yè)服務,因此一定是往行業(yè)走。
大模型與行業(yè)結合越深,其產(chǎn)生的價值也就越大。目前ChatGPT也在摸索對外的商業(yè)化,包括通過API(應用程序編程接口)訂閱服務等,就如谷歌在互聯(lián)網(wǎng)時代基于流量的廣告模式。
API價值偏低,它的技術理解門檻也比較高,需要企業(yè)專人負責調用。而對于大模型開發(fā)企業(yè)來說,很容易陷入API價格戰(zhàn),變成一門負向的業(yè)務。
由此而論,大模型時代,API接口未必是主流的商業(yè)化路徑,原因在于,它與行業(yè)連接太淺,對產(chǎn)業(yè)的技術要求也太高,賣產(chǎn)品和私有化部署大模型或許才是正路。據(jù)悉,已有人開始叫賣大模型,1000萬元就能買到一個完整數(shù)據(jù)、算法、算力的大模型。
在上海,也有一些“云買手”嘗試用大模型為客戶服務。以往,他們通過人工服務數(shù)十個客戶,人均年盈利在二三十萬元之間,這就到了天花板。但用上大模型之后,他們人均服務的客戶量翻了10倍,釋放了大量的生產(chǎn)力以及利潤空間。
與業(yè)內資深人士的看法類似,何曉冬也認為生成式人工智能是一個完全不同于移動互聯(lián)網(wǎng)時代的物種。相較于移動互聯(lián)網(wǎng)時期,京東的探索要更前置,更貼合業(yè)務,更不能回避競爭。
事實上,此次大模型之爭,大公司競爭的中心點不在資本、地推或者補貼策略,而是各自的研究院或者實驗室以及落地場景。
不管是京東還是阿里巴巴、騰訊,他們都有自己的研究院或者人工智能實驗室,比如2017年成立的阿里達摩院,2012年成立的騰訊優(yōu)圖實驗室,2014年成立的百度研究院,2017年成立的京東人工智能研究院和2020年成立的京東探索研究院。
當前技術大咖們走到了價值創(chuàng)造階段,他們需要驗證,大公司投入的數(shù)十億元甚至數(shù)百億資金不是泡影。
騰訊成立了專門的技術委員會協(xié)調各大實驗室。騰訊對于研發(fā)的態(tài)度是,不會取消所有冒險研究,始終會保留一支小分隊探索前沿,留下火種。
何曉冬說,他給了京東探索研究院三個任務,第一,要在重要的競爭激烈的領域做到前沿,不回避競爭,愿意挑戰(zhàn)和競爭;第二,對重要業(yè)務和產(chǎn)品要形成支撐,對公司有價值;第三,要有足夠的前瞻性。
創(chuàng)始人與一號項目
從2月高舉大旗到6月病退,王慧文的軌跡似乎預示著此次大模型創(chuàng)業(yè)熱暫告一段落,他創(chuàng)立的光年之外最終被美團收購。坐到牌桌上的,只剩下大公司。
巨頭公司爭斗往往表面悄無聲息,但碰撞在一起的剎那,所產(chǎn)生的能量也是驚人的,甚至會掀翻某個旁觀者, BAT時代曾發(fā)生的邊界大戰(zhàn),就如同今日的一個序章。
外部環(huán)境急劇變化,既有宏觀層面的挑戰(zhàn),也有AI浪潮的興起,這些正在讓大公司的CEO或者創(chuàng)始人重回一線。
張勇將于今年9月卸任阿里巴巴集團董事會主席兼CEO職務,專職擔任阿里云智能集團董事長兼CEO,他希望在那里再造一個阿里巴巴。李彥宏、周鴻祎等紛紛出場,為自家大模型產(chǎn)品代言和推介。
京東集團新任CEO許冉說:“當產(chǎn)業(yè)效率和產(chǎn)業(yè)的邊界拓展得到質的提升后,大模型才有更重要的實際價值和意義,將不亞于又一次工業(yè)革命?!痹诖饲罢匍_的2023京東全球科技探索者大會上,她提出了京東對于大模型價值的公式,大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。
創(chuàng)始人與CEO的關注,既能讓項目在公司內部獲得大量資源支持,但也會帶來壓力,那就是盡快產(chǎn)生營收、利潤回報。
何曉冬坦言,京東言犀大模型的當下還是一個成本中心,但集團對大模型項目還沒有盈利要求;具體到自己負責的智能服務板塊,則已經(jīng)實現(xiàn)了盈利,這也是大模型產(chǎn)業(yè)化應用價值的縮影。
如果說,AI是一條河,那么各家公司的產(chǎn)品方案有的是架橋,有的是鋪路,有的是造船,各有不同。誰最終越過科學研究到實際產(chǎn)品轉化鴻溝的這片“達爾文之?!?#xff0c;只能留給時間來驗證。
相關稿件