9月11日,2024 IDC中國年度盛典暨頒獎典禮在上海盛大啟幕。本次峰會以「AI時刻,歡迎來到下一個大事件」為主題,匯聚行業(yè)專家、意見領(lǐng)袖,深度探討生成式AI、中國企業(yè)出海、創(chuàng)新業(yè)務(wù)模式、科技可持續(xù)發(fā)展、數(shù)據(jù)安全、數(shù)字工業(yè)、數(shù)字金融等熱門話題。天翼云科技有限公司市場營銷部總經(jīng)理王彥丹出席峰會主論壇并發(fā)表演講,分享了云智一體時代背景下,天翼云如何以堅實的國云智算底座驅(qū)動產(chǎn)業(yè)數(shù)智化轉(zhuǎn)型加速,開創(chuàng)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展新未來。
以大模型為代表的生成式AI飛速發(fā)展,人工智能產(chǎn)業(yè)化、商業(yè)化進(jìn)程不斷提速,這不僅對基礎(chǔ)設(shè)施提出了全新挑戰(zhàn),更促使云廠商加速布局智算基礎(chǔ)設(shè)施建設(shè),不斷提升算力與存力,以滿足海量數(shù)據(jù)處理和模型訓(xùn)練等需求。云智一體,已經(jīng)成為云計算產(chǎn)業(yè)發(fā)展的必然趨勢。作為云服務(wù)國家隊,天翼云構(gòu)建領(lǐng)先的“息壤”一體化智算服務(wù)體系,以豐富的智算資源供給、強(qiáng)大的智算服務(wù)能力和開放的模型應(yīng)用生態(tài),為千行百業(yè)轉(zhuǎn)型升級注智賦能。
豐富的智算資源供給,高效實現(xiàn)算力供需匹配
天翼云自建豐富、形態(tài)多樣的智能算力資源。圍繞AI產(chǎn)業(yè)集聚地區(qū),天翼云規(guī)劃建設(shè)北京、上海、廣東、浙江、安徽人工智能公共算力中心,并先后建成上海、北京萬卡池,這也是全國最早建成并真正投產(chǎn)運(yùn)行的兩個國產(chǎn)化、全液冷、單集群萬卡公共智算中心;在內(nèi)蒙古、貴州、寧夏等清潔能源集聚地建設(shè)智算中心,為用戶提供綠色算力。此外,天翼云還在280多個地市的一城一池節(jié)點(diǎn)和1000多個邊緣節(jié)點(diǎn)按需下沉AI云電腦算力和推理算力;提供國內(nèi)外主流的GPU、NPU算力方案,面向不同場景為用戶提供公有云、私有云、邊緣云多種形態(tài)服務(wù)。
在自建算力的同時,天翼云發(fā)揮“息壤”的強(qiáng)大算網(wǎng)調(diào)度能力,大規(guī)模匯聚社會各方算力,促進(jìn)算力互聯(lián)互通、高效利用和供需匹配?;谠谒懔y(tǒng)一接入、算數(shù)網(wǎng)整體調(diào)度、算力便捷使用三個方面的顯著技術(shù)突破,“息壤”可服務(wù)于三大算力場景:一是天翼云自營公共算力服務(wù)平臺,目前已接入39家算力伙伴,實現(xiàn)三方各類算力可調(diào)度,顯著擴(kuò)大算力規(guī)模和品類,滿足公有云客戶的多元算力需求;二是幫助客戶構(gòu)建行業(yè)算力互聯(lián)網(wǎng),例如高校算力聯(lián)盟等,實現(xiàn)行業(yè)內(nèi)算力利用率的有效提升;三是幫助地方政府構(gòu)建城市算力互聯(lián)網(wǎng),實現(xiàn)區(qū)域內(nèi)多方算力的一體化統(tǒng)籌調(diào)度,助力地方經(jīng)濟(jì)和產(chǎn)業(yè)發(fā)展。
強(qiáng)大的智算服務(wù)能力,降低大模型應(yīng)用創(chuàng)新開發(fā)門檻
“息壤”具備高效的異構(gòu)計算能力,可為萬億參數(shù)基礎(chǔ)大模型提供高性能計算服務(wù)。在大算力需求方面,天翼云建設(shè)PB級并行文件存儲,并組建低延時超大規(guī)模RDMA網(wǎng)絡(luò),通過計算、內(nèi)存和通訊的多維優(yōu)化,提升綜合算效。在性能方面,對AI框架進(jìn)行升級、存儲加速,實現(xiàn)checkpoint文件快速保存、加載,將國產(chǎn)算力的綜合算效提升到了行業(yè)可比水平。在穩(wěn)定性方面,通過多項指標(biāo)的監(jiān)控分析,實現(xiàn)故障訓(xùn)前發(fā)現(xiàn),有效控制大模型訓(xùn)練中斷恢復(fù)時長,實現(xiàn)訓(xùn)練任務(wù)長期穩(wěn)定、高可用運(yùn)行?;趪a(chǎn)萬卡智算集群和自研智算平臺,天翼云已具備支撐萬億參數(shù)基礎(chǔ)大模型訓(xùn)練的能力。
“息壤”一站式訓(xùn)推服務(wù)能力,可降低大模型應(yīng)用創(chuàng)新開發(fā)門檻。天翼云將大模型精調(diào)場景簡化操作至選數(shù)據(jù)、選硬件和選模型三個步驟,顯著提升部署效率;通過自研AI框架、3D并行加速、自研訓(xùn)練加速庫、容器調(diào)度優(yōu)化等核心技術(shù),大幅提升訓(xùn)練效率;通過模型量化壓縮、自研推理加速算子庫、自研AI推理加速框架等核心技術(shù),提高推理效率;通過全鏈路故障檢測、定位、告警,全鏈路日志監(jiān)控與可視化、斷點(diǎn)續(xù)訓(xùn)快速恢復(fù)等核心技術(shù),實現(xiàn)訓(xùn)推過程全鏈路監(jiān)控。
開放的模型應(yīng)用生態(tài),加快推動AI應(yīng)用落地
開放合作共享的生態(tài)是產(chǎn)業(yè)進(jìn)一步繁榮發(fā)展的基礎(chǔ)。天翼云全新升級AI電腦,開放AI云電腦平臺,打造AI應(yīng)用中心,具備AI助手、AI空間、AI客服、AI低代碼等AI創(chuàng)新應(yīng)用,使AI應(yīng)用能夠更廣泛地接入和使用。
此外,天翼云魔樂(Modelers)開發(fā)者社區(qū),攜手伙伴為開發(fā)者提供一個交流、學(xué)習(xí)和創(chuàng)新的平臺。魔樂社區(qū)集成了開發(fā)工具鏈、模型庫、數(shù)據(jù)集和體驗空間等核心組件,覆蓋自然語言處理、視覺、音頻等領(lǐng)域,提供原生模型、易用開發(fā)工具、豐富的生態(tài)資源,致力于聚合優(yōu)質(zhì)中文AI資源,使能AI應(yīng)用創(chuàng)新,加速伙伴商業(yè)閉環(huán),通過提供極致易用的工具鏈,端到端支持AI應(yīng)用開發(fā)的全流程。
伴隨新一輪人工智能浪潮涌動以及AI規(guī)模化落地應(yīng)用,智算基礎(chǔ)設(shè)施的重要性愈發(fā)凸顯。作為云計算原創(chuàng)技術(shù)策源地、數(shù)字中國建設(shè)主力軍,天翼云將不斷夯實國云智算底座,持續(xù)突破技術(shù)創(chuàng)新的邊界,強(qiáng)化服務(wù)能力,以普惠智能算力賦能千行百業(yè)蝶變,攜手各界伙伴共繪數(shù)智化新藍(lán)圖。
相關(guān)稿件