算力是數(shù)字經(jīng)濟的底座,一個國家適度超前布局算力基礎設施建設,有重要意義。
第三方市場調研機構IDC在《2021-2022全球計算力指數(shù)評估報告》中分析了包括美國、中國等15個重點國家的算力指數(shù)(根據(jù)多項指標測算的算力綜合指數(shù))得出的結論是:算力指數(shù)平均每提高1點,國家的數(shù)字經(jīng)濟和GDP將分別增長3.5‰和1.8‰。
每一代網(wǎng)絡基礎設施都會催生新一代產(chǎn)業(yè)。不同算力基礎設施上,也會誕生不同的軟件。3G、4G網(wǎng)絡讓移動互聯(lián)網(wǎng)誕生。在傳統(tǒng)的CPU算力上誕生了云。以GPU為代表的AI算力,則催生了ChatGPT和AI大模型。
2022年12月,微軟投資的AI創(chuàng)業(yè)公司OpenAI推出了聊天機器人ChatGPT。ChatGPT本質是OpenAI自主研發(fā)的GPT-3.5語言大模型,該大模型包含近1800億個參數(shù)。2023年3月15日,OpenAI將該大模型迭代至GPT-4.0。GPT-3.5只是單模態(tài)大模型,只能回復文本。但GPT-4.0是多模態(tài)大模型,能同時實現(xiàn)圖像、文本輸入。GPT-4.0的回復準確度、語義理解力大幅提升。
今年2月,阿里、百度等中國企業(yè)宣布將研發(fā)類ChatGPT產(chǎn)品,或將投入生成式AI的研發(fā)。3月16日,百度發(fā)布了對標ChatGPT的大語言模型“文心一言”。不過,目前中國企業(yè)對外發(fā)布的大模型普遍是單模態(tài)的,且普遍面臨GPU算力不足的挑戰(zhàn)。
《財經(jīng)》在3月初與三位技術背景出身的專家進行了一場對話。他們經(jīng)歷了中國產(chǎn)業(yè)技術發(fā)展的不同階段,擁有不同領域的專業(yè)視角。這場對話的主題是,“中國離算力自由有多遠”。我們在這場對話中探討了三大問題:
智能算力是什么,為何興起?智能算力會帶來哪些產(chǎn)業(yè)變革?中國要如何科學規(guī)劃算力產(chǎn)業(yè)?
對話人簡介:
新華三集團副總裁、計算存儲產(chǎn)品線總裁 徐潤安(新華三是國內重要的數(shù)字化解決方案提供商。新華三提供計算、存儲、網(wǎng)絡、5G、安全、終端等數(shù)字化基礎設施,客戶覆蓋百行百業(yè))
百度杰出系統(tǒng)架構師 王雁鵬(百度智能云業(yè)務2022年營收177億元,正在成為集團的第二增長曲線。3月16日,百度發(fā)布了對標ChatGPT的大語言模型“文心一言”)
獨立分析師,數(shù)字化行業(yè)專家 寧宇
主持人:《財經(jīng)》雜志副主編 謝麗容
以下是對話實錄精華版:
智能算力是什么,為何興起?
《財經(jīng)》謝麗容:ChatGPT的風靡讓大家關注智能算力,就像多年前谷歌的AlphaGo戰(zhàn)勝圍棋世界冠軍時,讓普通人認識了人工智能,算力是什么?尤其智能算力是什么?它是一種什么樣的資源?
寧宇:算力是通過對信息數(shù)據(jù)進行處理,實現(xiàn)目標結果輸出的計算能力。算力會和算法、存儲一起構成我們數(shù)字社會的基礎。
徐潤安:大眾意義上理解的通用算力是CPU(中央處理器)。無論個人使用的電腦、手機,企業(yè)使用的服務器都最關心CPU主頻性能。這是衡量算力的一個重要指標。但數(shù)字化正在讓算力需求發(fā)生變化。CPU作為通用算力,已經(jīng)無法完全滿足新需求。異構算力,比如GPU(圖形處理器)、DPU(深度學習處理器)、NPU(神經(jīng)網(wǎng)絡處理器)通常被用來處理AI計算的需求。所以通常也被稱為智能算力。
王雁鵬:智能算力和通用算力采用了不同的計算方法。以CPU為代表的通用算力,善于執(zhí)行邏輯指令進行高效率的計算。GPU為代表的智能算力,善于處理大量無邏輯關系數(shù)據(jù)的并行計算。
AI訓練和推理通常不涉及復雜控制指令,卻又依賴大量數(shù)據(jù)的并行運算。GPU/DPU/NPU這些專用處理器因此誕生。在過去的計算體系結構中,CPU要處理所有工作?,F(xiàn)在的計算體系結構形成了不同的分工。GPU/DPU/NPU會針對不同的場景去做深度的優(yōu)化定制。
《財經(jīng)》謝麗容:ChatGPT這類AI應用正在讓智能算力需求爆發(fā)。2022年中國服務器出貨量約380萬臺,AI服務器出貨量超25萬臺,在大盤中占比約6.5%。哪些行業(yè)、哪些領域對智能算力有強需求?
徐潤安:典型的使用場景包括互聯(lián)網(wǎng)的搜索和推薦、零售電商業(yè)務數(shù)據(jù)分析;政府的智慧城市及治理,比如新華三已經(jīng)為杭州濱江、呼和浩特等60余個地市通過城市大腦進行公共事務的輔助決策;自動駕駛的仿真訓練,需要大量真實道路數(shù)據(jù)進行模擬學習。
王雁鵬:百度在AI領域投入很久,云業(yè)務標簽是“智能云”。我們提出了一個理念,叫AINative(AI原生)。也就是說,千行百業(yè)都可以使用AI算力和模型訓練。例如,金融機構反欺詐、鋼鐵工廠AI質檢、能源企業(yè)的線路檢修都采用了百度類似深度應用。這個趨勢未來會給各行業(yè)帶來翻天覆地的變化。不過,這需要一段時間。
《財經(jīng)》謝麗容:這么多領域都要用到智能算力,那么資源相對充沛的通用算力是不能用,還是效率跟不上?從客戶需求來看,智能算力占比已經(jīng)超過甚至替代通用算力了?
徐潤安:這是計算效率的問題。最常見的CPU算力是x86服務器芯片。x86芯片單核性能強、通用性好,但是AI場景通常需要多核、高并發(fā)、高帶寬的芯片。綜合考慮成本、效率,GPU/DPU/NPU這些專用處理器通常會處理得更好。
現(xiàn)代計算機是遵循馮·諾依曼架構設計的,這套架構已經(jīng)延續(xù)70多年。可以確定的是,CPU作為中央處理器的地位在短期內不會改變。只是在數(shù)據(jù)挖掘等場景下,CPU的職能被其他專用芯片分擔了。CPU、GPU及其他AI芯片,這三種蛋糕的比例會有變化。不過未來會誕生新的計算機架構。
現(xiàn)在有一種理念叫做“多元算力”。過去10年大家通常只談x86計算架構。但計算芯片和計算進程都在多元化,這是必然的趨勢。
王雁鵬:簡單理解的話,CPU像是大腦,它需要完成復雜的邏輯。GPU/DPU/NPU這些專用芯片就像四肢。它們不需要腦子太發(fā)達,只需要四肢足夠強壯,去解決需要解決的工作。
《財經(jīng)》謝麗容:把CPU/GPU/DPU/NPU這些算力資源組合在一起,什么樣的組合才是效率最高的?專用芯片是不是需要足夠大的規(guī)模,成本才會下降?
寧宇:通常情況下,特殊需求一定要足夠大的規(guī)模,才能支撐起專用芯片。專用芯片,需要規(guī)?;\作,才能更經(jīng)濟。多元算力持續(xù)增長,專用需求規(guī)?;瘮U張。這才會讓專用芯片的研發(fā)、生產(chǎn)、制造需求也不斷擴大。另一種場景是,傳統(tǒng)芯片無法完成新的工作。因此,哪怕成本更高,也需要用專用芯片去解決,企業(yè)自然而然也會去使用專用芯片。
徐潤安:是否使用專用芯片其實是種商業(yè)考量。所有活動都要考慮投入產(chǎn)出比,追根溯源還是效率問題。專門為一個算法或一個場景研發(fā)專用芯片,前提是可以產(chǎn)生足夠的效益,最終能覆蓋研發(fā)和制造成本。過去幾十年,x86架構芯片的生產(chǎn)成本降到了很低,因此CPU無法被替代。但是大模型和其他業(yè)務場景的出現(xiàn),專用芯片的綜合計算效率更高,使得其他廠商有機會研發(fā)生產(chǎn)專用芯片。
《財經(jīng)》謝麗容:專用芯片需要面臨成本、效率這個矛盾。ChatGPT背后的AI大模型和生成式AI是不是也需要面臨類似的矛盾?如何解決這些問題?
王雁鵬:阻礙上一代AI技術大規(guī)模落地的瓶頸有三個。一是企業(yè)需要針對不同業(yè)務場景,定制不同的算法,研發(fā)成本很高。二是,AI的后面是人工,企業(yè)需要耗費大量人工去標注數(shù)據(jù),人力有限且成本高昂。三是,語音、圖像、自然語言分別有不同的研究框架,三者無法融合。
大模型代表了新一代AI技術,帶來了里程碑式的變化,解決了三個核心問題。一是,一個通用的算法就可以應對過去數(shù)十種場景,落地空間變得更大。二是,數(shù)據(jù)無需人工標注,大量數(shù)據(jù)可以得到自動訓練,而且模型結構是統(tǒng)一的。三是,語音、圖像、自然語言可以實現(xiàn)多模態(tài)融合,三者互相關聯(lián)。AI的思考方式會更符合人類認知方式。上述三個變化,更通用的模型、大規(guī)模數(shù)據(jù)訓練、多模態(tài)融合,會帶來AI技術的井噴和AI應用的爆發(fā)。
寧宇:過去AI模型往往用于專業(yè)領域、專業(yè)場景。大模型讓AI能夠成為通用工具平臺,應對足夠多的場景。上層AI應用使用規(guī)模變大,會激發(fā)AI算力的需求,進而會使得下層硬件可以衍生出專用AI場景的芯片、服務器。這是一個從專業(yè)到通用再到專業(yè)的產(chǎn)業(yè)循環(huán)。
徐潤安:AI從水平場景影響到了應用、硬件一個個不同的層次,這使得業(yè)務既解耦又打通。比如,底層的智能算力可以提供專用芯片,進一步降低上層AI應用的成本。
智能算力會帶來哪些產(chǎn)業(yè)變革?
《財經(jīng)》謝麗容:AI技術這輪演變和創(chuàng)新會帶來大量新的機會,其中誰會受益?是不是會有一批優(yōu)秀的創(chuàng)業(yè)公司誕生?未來會形成怎樣的產(chǎn)業(yè)生態(tài)?
徐潤安:生成式AI爆發(fā)會帶來巨大的算力消耗,那么第一輪機會是ICT企業(yè)的。頭部企業(yè)投入大模型研發(fā),對新華三這種ICT企業(yè)來說就是機會。我們有更多機會服務好這些頭部客戶,為他們建設基礎設施。
第二輪機會是頭部大公司的。頭部廠商開發(fā)出大模型之后,可以利用平臺對外賦能。對外服務的過程,也是這些大公司受益的過程。
第三輪機會是各類創(chuàng)業(yè)公司的。大公司研發(fā)出大模型后,會形成平臺生態(tài)。大量公司在平臺上,針對千行百業(yè)研發(fā)上層AI應用。黃教主(英偉達CEO黃仁勛)說,ChatGPT相當于iPhone。iPhone帶來了移動互聯(lián)網(wǎng)的爆發(fā),大模型也是類似的。這個過程中會有起有伏,有人成功有人失敗,但一定會有最終的受益者。
王雁鵬:在AI領域,百度有芯片、框架、大模型和應用的全面積累。
我認為未來可能會形成三層生態(tài)?;A層是提供基礎大模型服務的企業(yè),只有大公司才有能力。因為這需要長期投入,如資金、人力和技術積淀。第二層主要是各領域的公司。一些公司有較強的行業(yè)研究能力,可以基于大模型做各領域的專業(yè)應用。第三層是開發(fā)者。他們只需要放開手腳,把應用做好。開發(fā)者一定是更繁榮和開放的生態(tài)。
寧宇:大模型可能會讓AI產(chǎn)業(yè)出現(xiàn)類似移動互聯(lián)網(wǎng)誕生前后的產(chǎn)業(yè)變革。早年通信設備商為電信運營商提供硬件,中國移動、中國聯(lián)通、中國電信鋪設3G、4G高速通信網(wǎng)絡?;A設施建設完成后,移動互聯(lián)網(wǎng)群雄并起。微信、淘寶、支付寶這些APP都因此誕生。
AI產(chǎn)業(yè)在中國發(fā)展很快,現(xiàn)在新華三這類企業(yè)為大廠提供硬件,助力建設算力中心,大廠建成大模型,大模型上會雨后春筍般孵化出AI應用。AI產(chǎn)業(yè)鏈會重構,大中小企業(yè)都可以找到自己的定位。所以,黃教主才會說,ChatGPT出現(xiàn)不亞于iPhone誕生給產(chǎn)業(yè)帶來的沖擊。
要如何科學規(guī)劃算力產(chǎn)業(yè)?
《財經(jīng)》謝麗容:ChatGPT出現(xiàn)后,國內部分企業(yè)正在開始追趕。但也有人質疑,我們的算力、算法、數(shù)據(jù)實力能不能支撐中國做好類似的應用?
王雁鵬:在AI領域,中國和美國是絕對領先的。當前中國算力的確受到了一定制約。但從長線來看,一定可以突破,我對此有信心。接下來的挑戰(zhàn)是,數(shù)據(jù)是不是夠多。客觀現(xiàn)狀是,中文數(shù)據(jù)豐富度小于英文,但模型的邏輯推理能力可以彌補這個短板。
寧宇:算力、算法、數(shù)據(jù),這些要素其實中國都有。我們未來的問題是監(jiān)管這類非技術因素。訓練內容如何監(jiān)管、應用場景如何適配、社會如何跟進技術發(fā)展,這都是挑戰(zhàn)。
《財經(jīng)》謝麗容:ChatGPT這類生成式AI應用和大模型正在涌現(xiàn)。面向未來,中國應該如何科學地規(guī)劃自己的算力產(chǎn)業(yè)?
王雁鵬:我們希望,算力的供給能像水電一樣簡單。以CPU為代表的通用算力有標準的軟件、接口,在云上已接近水電。但是GPU/DPU/NPU這些異構算力,軟件復雜度越來越高。它的使用并不像CPU那樣簡單。這意味著我們需要芯片、框架、模型、應用都一體化整合發(fā)展。這樣才能把智能算力也變成CPU算力一樣標準化的水電資源。
徐潤安:我們需要摒棄過去幾十年看待算力的視角。過去是攤大餅似的買設備,堆砌算力,這種發(fā)展模式太粗放了。一方面我們需要應對多元算力的發(fā)展趨勢,讓算力得到更高效使用。另一方面,算力對電力消耗很大,所以這也催生了東數(shù)西算這樣的政策規(guī)劃。
此外,中國一直在提“算力網(wǎng)絡”概念,思考如何把國內的數(shù)據(jù)中心跨區(qū)域連接在一起。這是個系統(tǒng)工程。如果算力網(wǎng)絡建成,算力、存儲、網(wǎng)絡都可以統(tǒng)一調度,那么它會成為數(shù)字化變革的核心。新華三在去年推出了H3CUniServerG6新一代AI服務器,為此還搭配了智能管理中樞,這就像是算力操作系統(tǒng)?,F(xiàn)在的異構算力太多了,我們希望彌補這些鴻溝,讓企業(yè)能更簡單、高效地使用AI算力。
寧宇:算力作為資源需要整體分配。對企業(yè)來說,需要不斷降低算力成本。對國家來說,需要對產(chǎn)業(yè)鏈的不同角色進行重新定位。東數(shù)西算與碳中和等其他國家戰(zhàn)略是相互匹配的。就像中國建設高鐵、4G/5G網(wǎng)絡一樣,算力基礎設施建設也要有規(guī)劃。既要讓成本足夠經(jīng)濟,又要讓地區(qū)平衡發(fā)展,還要協(xié)調算力基建、AI應用的供需節(jié)奏。
把分散的服務器、數(shù)據(jù)中心簡單匯總計算出中國總體算力,這種統(tǒng)計方式便于操作。但我個人并不完全贊同拿浮點運算總數(shù)去衡量一個國家的算力能力。政策方提“算力網(wǎng)絡”、“云網(wǎng)融合”概念,是因為算力相連成網(wǎng)絡之后才有意義。這就像局域網(wǎng)不成體系,互聯(lián)網(wǎng)才能創(chuàng)造產(chǎn)業(yè)價值。
《財經(jīng)》謝麗容:以電信行業(yè)為例,中國普通人的的通信自由,不為流量資費發(fā)愁的日子似乎是從4G開始的。對中國來說,什么是算力自由?算力自由是什么狀態(tài)?
王雁鵬:我理解的算力自由是,算力要支撐算法的發(fā)展,不要限制人類的想象力。從歷史發(fā)展來看,大型機/小型機被x86架構芯片取代,原因是大型機/小型機太昂貴,無法建成互聯(lián)網(wǎng)和云計算?;ヂ?lián)網(wǎng)讓廉價的x86架構芯片最終一統(tǒng)天下。Google在2003年-2006年發(fā)表的三篇論文又為云計算奠定理論基礎——用廉價的通用計算設備(x86架構,Linux系統(tǒng))搭建低成本的計算集群。每個時代都可以重構不同的計算模式。這需要百度、新華三等企業(yè)在不同領域跨產(chǎn)業(yè)層的努力。
寧宇:第一是便宜,第二是易用。每一代通信技術迭代的周期是10年左右。電信運營商在這個周期內,一方面要保證經(jīng)營能夠覆蓋基站的建設、維護成本,另一方面要讓用戶增長和網(wǎng)絡規(guī)模同步發(fā)展。在這兩個平衡的前提下提速降費,實現(xiàn)通信自由。未來如果有算力運營商,或者說是今天的云計算廠商,國家需要有宏觀政策指導產(chǎn)業(yè)演進。讓資源供給、市場需求以及運營商的收入能夠實現(xiàn)良好的匹配。
徐潤安:算力自由不是簡單的攤大餅,核心是供需平衡。和通信產(chǎn)業(yè)不同的是,通信技術10年一次迭代,但算力是3年-5年一次,因為服務器的平均使用周期大約是4年。這會導致算力運營商的成本是偏高的。算力設備采購后,3年內必須充分發(fā)揮作用。如果算經(jīng)濟賬,這會帶來很大的挑戰(zhàn)。
關于算力的技術演進,這需要端到端的優(yōu)化,產(chǎn)業(yè)鏈從上到下打破這壁壘。新華三和這類云計算廠商、三大電信運營商都需要探討這些需求。我們不能只生產(chǎn)、提供設備,我們需要對未來做出預測,進行適當?shù)耐度?#xff0c;提前做技術布局。
相關稿件