隨著大數(shù)據(jù)、人工智能和高性能計(jì)算的迅猛發(fā)展,在大數(shù)據(jù)分析、基因測(cè)序、芯片設(shè)計(jì)、數(shù)據(jù)庫(kù)和AI訓(xùn)練等“大計(jì)算”應(yīng)用場(chǎng)景中,計(jì)算資源需求呈現(xiàn)爆發(fā)式增長(zhǎng)態(tài)勢(shì),而傳統(tǒng)的計(jì)算架構(gòu)在資源利用率、擴(kuò)展性、IO性能等方面存在諸多挑戰(zhàn)。
為了應(yīng)對(duì)這些挑戰(zhàn),天翼云提出全新的云計(jì)算基礎(chǔ)設(shè)施產(chǎn)品理念——聚合計(jì)算,旨在突破物理限制,資源池化分離,聚合異構(gòu)算力。天翼云聚合計(jì)算是由天翼云自主研發(fā)的下一代云計(jì)算算力基礎(chǔ)設(shè)施,面向數(shù)據(jù)庫(kù)、芯片設(shè)計(jì)、大數(shù)據(jù)、AI訓(xùn)練等場(chǎng)景,提供超聚合主機(jī)、超大內(nèi)存主機(jī)、內(nèi)存即服務(wù)、池化計(jì)算加速四種產(chǎn)品和服務(wù)。通過(guò)高速總線互聯(lián)技術(shù),聚合計(jì)算不僅繼承了傳統(tǒng)云主機(jī)彈性、高可靠等優(yōu)勢(shì),同時(shí)具備內(nèi)存跨機(jī)共享、vCPU“無(wú)限”擴(kuò)展和內(nèi)存空間熱變配等特性,為復(fù)雜業(yè)務(wù)場(chǎng)景提供源源不斷的算力。
依托領(lǐng)先的高速總線互聯(lián)技術(shù),天翼云聚合計(jì)算平臺(tái)通過(guò)“分離”與“聚合”兩大創(chuàng)新理念,實(shí)現(xiàn)了計(jì)算資源的高效利用和靈活擴(kuò)展。其中,在分離方面,傳統(tǒng)計(jì)算架構(gòu)中的CPU、內(nèi)存和存儲(chǔ)資源通常緊密耦合在一起,限制了資源的靈活調(diào)度和高效利用,并且傳統(tǒng)的存算分離只是將磁盤(pán)存儲(chǔ)從計(jì)算節(jié)點(diǎn)放到遠(yuǎn)端,形成存儲(chǔ)池,內(nèi)存仍舊在本地計(jì)算節(jié)點(diǎn)中。天翼云聚合計(jì)算平臺(tái)在此基礎(chǔ)上,將內(nèi)存也抽離出來(lái),形成獨(dú)立內(nèi)存池資源,具有獨(dú)立的高可用和彈性優(yōu)勢(shì),從而實(shí)現(xiàn)了存算分離架構(gòu)的“最后五公里”。聚合是指天翼云聚合計(jì)算平臺(tái)在資源分離基礎(chǔ)上實(shí)現(xiàn)了資源的按需組合,用戶可以根據(jù)具體需求,將CPU、內(nèi)存和存儲(chǔ)資源靈活組合,形成適合特定任務(wù)的計(jì)算實(shí)例。
基于分布式虛擬化、零數(shù)據(jù)拷貝總線網(wǎng)絡(luò)、內(nèi)存池化與共享等創(chuàng)新技術(shù),天翼云聚合計(jì)算平臺(tái)在通算、智算、超算、數(shù)據(jù)庫(kù)等多個(gè)“大計(jì)算”應(yīng)用場(chǎng)景中展現(xiàn)出強(qiáng)大的優(yōu)勢(shì)。
在通算的量化交易場(chǎng)景中,量化交易需要對(duì)交易所每支股票的數(shù)據(jù)進(jìn)行獨(dú)立分析、計(jì)算、預(yù)測(cè),從而生成不同的交易策略。這類計(jì)算為非矩陣運(yùn)算,只能在CPU中進(jìn)行計(jì)算,所以CPU的核數(shù)越多,并行處理的股票就越多,隨之收益就越高。針對(duì)股票不同的投資策略,用戶可以通過(guò)天翼云超聚合主機(jī)自動(dòng)擴(kuò)容,充分利用多核算力進(jìn)行業(yè)務(wù)加速。
在智算場(chǎng)景中,天翼云超聚合主機(jī)可以實(shí)現(xiàn)大模型分布式訓(xùn)練業(yè)務(wù)統(tǒng)一內(nèi)存視圖,以及基于共享內(nèi)存語(yǔ)義的跨物理主機(jī)數(shù)據(jù)共享。同時(shí),彈性共享內(nèi)存池可充當(dāng)存儲(chǔ)集群的緩存,減少大量基于網(wǎng)絡(luò)的數(shù)據(jù)搬運(yùn)開(kāi)銷。
在超算場(chǎng)景中,基因測(cè)序業(yè)務(wù)對(duì)內(nèi)存資源的需求量非常大,但是對(duì)內(nèi)存讀寫(xiě)時(shí)延及帶寬資源不敏感?;诖祟愋枨罂梢岳锰煲碓瞥髢?nèi)存主機(jī)帶來(lái)的大內(nèi)存、內(nèi)存池化共享的特性實(shí)現(xiàn)業(yè)務(wù)加速。
在數(shù)據(jù)庫(kù)場(chǎng)景中,通過(guò)高速總線互聯(lián),天翼云超聚合主機(jī)可將多臺(tái)物理機(jī)聚合為一個(gè)主機(jī)實(shí)例,特別是針對(duì)集中式數(shù)據(jù)庫(kù),可顯著降低應(yīng)用程序在不同物理機(jī)節(jié)點(diǎn)之間及不同SQL節(jié)點(diǎn)間通信的開(kāi)銷,有效提升數(shù)據(jù)庫(kù)處理效率,從而滿足各種高性能和復(fù)雜數(shù)據(jù)庫(kù)部署場(chǎng)景需求。
作為云服務(wù)國(guó)家隊(duì),天翼云提出聚合計(jì)算理念并推進(jìn)落地應(yīng)用,賦能云計(jì)算基礎(chǔ)設(shè)施全面升級(jí)。未來(lái),天翼云將以聚合計(jì)算為抓手,繼續(xù)引領(lǐng)云計(jì)算產(chǎn)業(yè)變革,為客戶提供更加高效、靈活的計(jì)算服務(wù),使能行業(yè)數(shù)智化轉(zhuǎn)型升級(jí)。