国产裸体裸拍在线观看,欧美色色一级有声色色色,美日韩国产av一级片,在线观看黄片www,一级做a爱片久久毛片,国产91影院,亚洲福利免费精品视频

中國企業(yè)報集團(tuán)主管主辦

中國企業(yè)信息交流平臺

微博 微信

算力存力Buff都疊滿,至強(qiáng)6最強(qiáng)形態(tài)現(xiàn)身!

2024-09-27 11:26 來源:中國企業(yè)網(wǎng) 次閱讀
 
算力存力Buff都疊滿,至強(qiáng)6最強(qiáng)形態(tài)現(xiàn)身!

2024年是至強(qiáng)的大年。

先于6月正式發(fā)布的至強(qiáng)? 6700E系列開啟了全新的、更為簡潔命名方式:至強(qiáng)? 6能效核。144核的規(guī)格也意味著英特爾在最近幾年當(dāng)中首次在核心數(shù)量方面實(shí)現(xiàn)了領(lǐng)先。而且,這還并不是至強(qiáng)6的最強(qiáng)形態(tài),畢竟大家都知道還有個6900P系列嘛。

9月26日,至強(qiáng)6這個“最強(qiáng)形態(tài)”終于正式發(fā)布,主要規(guī)格非常震撼。即使面對今年內(nèi)晚于自己發(fā)布的其他廠商同級別CPU,至強(qiáng)? 6900P的已有規(guī)格也戰(zhàn)力十足。

最強(qiáng)至強(qiáng)能有多強(qiáng)?

英特爾代號Birch Stream的新一代服務(wù)器平臺所采用的至強(qiáng)6處理器是分批次發(fā)布的。6月發(fā)布的是代號Sierra Forest的能效核處理器6700E系列(E后綴即Efficiency Core,能效核的標(biāo)記),目前發(fā)布的是代號Granite Rapids的性能核6900P系列。今年底和明年初還會陸續(xù)發(fā)布6900E、6700P,以及6500/6300等。未來的Intel 18A制造工藝的處理器,如Clearwater Forest,也會繼續(xù)用于Birch Stream平臺。

至強(qiáng)6900P是英特爾專為計(jì)算密集型工作負(fù)載設(shè)計(jì)的處理器,也是Granite Rapids的“完全體”。后綴的“P”意味其采用的是Performance Core,即性能核,規(guī)模大、性能強(qiáng);6900的數(shù)字型號則說明其核心配置拉滿——提供了72到128核的多種規(guī)格,TDP有400W和500W兩種,組合成已公開5種型號,顯得比較簡潔。當(dāng)然,依照慣例,云廠商等大客戶還會有若干定制型號的。單就內(nèi)核數(shù)量而言,6900P系列相對前兩代“Rapids”產(chǎn)品線頂配的56/60(Sapphire Rapids)或64核(Emerald Rapids)直接翻倍!如此巨大的迭代幅度非常罕見,也難怪英特爾要改命名方式了,由表及里都透著一個意思:厚積薄發(fā)、脫胎換骨!

尤為值得一提的是:至強(qiáng)6900P也是業(yè)內(nèi)首款性能核數(shù)量正式“破百”的產(chǎn)品,其他同級產(chǎn)品,不論是x86架構(gòu)還是Arm架構(gòu)都只達(dá)到了96核的水平。它們的性能核數(shù)量要追平英特爾,起碼得等到下個季度。

隨著內(nèi)核規(guī)模增加,至強(qiáng)6900P的L3緩存達(dá)到了504MB。為了配合倍增的核數(shù)和顯著提升的算力,至強(qiáng)6900系列的存力也大為增強(qiáng),內(nèi)存帶寬方面不僅支持12通道DDR5 6400;并引入了新型內(nèi)存MR DIMM,把數(shù)據(jù)率大幅提升至8800MT/s,基本內(nèi)存帶寬可以達(dá)到第五代至強(qiáng)可擴(kuò)展處理器的2.3倍。另外,至強(qiáng)6還支持CXL 2.0,尤其是包括Type 3設(shè)備(也就是CXL內(nèi)存),可以進(jìn)一步擴(kuò)展內(nèi)存容量和帶寬。

至強(qiáng)6900P的UPI2.0鏈路也有很大改進(jìn),速率提升到24GT/s,數(shù)量增加至6條,使得雙路互聯(lián)效率進(jìn)一步提升。結(jié)合內(nèi)核數(shù)量、內(nèi)存帶寬等方面的全面提升,至強(qiáng)6900P可以被視作高算力+高存力平臺的最強(qiáng)機(jī)頭,不論是科學(xué)計(jì)算,還是AI集群。根據(jù)已透露的測試,至強(qiáng)6900P平臺的數(shù)據(jù)庫、科學(xué)計(jì)算等關(guān)鍵應(yīng)用負(fù)載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍,AI應(yīng)用性能是其1.83倍-2.4倍不等。

至強(qiáng)6的擴(kuò)展能力也有不小的提升。其中6900系列單插座不論是性能核還是能效核均可提供96通道PCIe 5.0,雙路即可提供192通道PCIe 5.0。未來上市的6700系列單路型號可以提供136通道PCIe 5.0,雙/多路型號單插槽也可以提供88通道。相較而言,第四、五代至強(qiáng)可擴(kuò)展處理器的PCIe 5.0通道數(shù)量為80。CXL支持能力方面,至強(qiáng)6 6900、6700系列都支持64通道CXL 2.0。

更多的內(nèi)核、更多的內(nèi)存通道、更多的PCIe通道需要更大規(guī)模的插座接口支持。 至強(qiáng)6帶來了兩種接口:LGA 4710和LGA 7529。至強(qiáng)6900系列使用面積較大的LGA 7529插座,提供最強(qiáng)大的內(nèi)存帶寬和擴(kuò)展能力,是未來高性能、高密度服務(wù)器的基礎(chǔ)。至強(qiáng)6700以及未來的6500/6300系列使用LGA 4710,尺寸與第四、五代至強(qiáng)的LGA 4677相仿,內(nèi)存、PCIe的通道數(shù)相同或相近,有利于主流服務(wù)器內(nèi)部布局習(xí)慣的延續(xù)性。

改進(jìn)的EUV:Intel 3

核心規(guī)模的飆升首先得益于至強(qiáng)產(chǎn)品線終于獲得EUV光刻機(jī)的加持。在2023年發(fā)布的酷睿Ultra已經(jīng)率先使用了引入EUV的Intel 4制造工藝。而2024年發(fā)布的至強(qiáng)6則使用了進(jìn)一步改良的Intel 3制造工藝。

2021年7月,英特爾CEO帕特·基爾辛格公布了“四年五個制程節(jié)點(diǎn)”(5N4Y)的工藝路線圖。Intel 3的量產(chǎn)時間節(jié)點(diǎn)位于2023年底,節(jié)奏基本符合計(jì)劃。從基于Intel 4制造工藝的酷睿Ultra的市場表現(xiàn)看,EUV的加持確實(shí)明顯提升了英特爾處理器的競爭力。至強(qiáng)6所采用的Intel 3制造工藝相對Intel 4可以規(guī)劃更多的金屬層、擁有更多細(xì)分版本。

Intel 3在更多的步驟中應(yīng)用EUV光刻,可以提供更密集的設(shè)計(jì)庫、更高的晶體管驅(qū)動電流。Intel 3還有三種變體,包括3-T、3-E和3-PT。Intel 3、3-T是基本工藝,主要用于CPU;3-E是功能擴(kuò)展;三者都支持TSV;Intel 3的這三種變體與Intel 4相比可以提升18%的性能功耗比。而3-PT進(jìn)一步增加混合鍵合的支持能力,帶來了更高的性能并且易于使用。Intel 3所有四種節(jié)點(diǎn)變體都支持240 nm高性能和210 nm高密度庫,而Intel 4只支持240 nm高性能庫。

對于性能取向,Intel 3針對高性能運(yùn)算進(jìn)行優(yōu)化,可以支持低電壓(<0.65V)和高壓(>1.3V)運(yùn)行,且在各電壓下的頻率均高于Intel 4。

微架構(gòu)大迭代

至強(qiáng)6900P采用的性能核微架構(gòu)代號Redwood Cove。Redwood Cove也是近年來英特爾最重要的微架構(gòu)迭代,不但給服務(wù)器產(chǎn)品線帶來了新名字,在消費(fèi)類產(chǎn)品線同樣開啟了新的命名序列酷睿Ultra。

我們先快速回顧一下Redwood Cove的上一代Golden Cove/ Raptor Cove。Golden Cove其實(shí)也是非常重要的迭代,在消費(fèi)類開啟了大小核時代(第12代酷睿處理器),在服務(wù)器上就是第四代至強(qiáng)可擴(kuò)展處理器。Golden Cove相對其前代的微架構(gòu)大幅度提升了前端:

  • 指令TLB翻倍,從128條增加到256條;

  • 指令提取帶寬從每周期16字節(jié)翻倍到32字節(jié);

  • 解碼器從4路擴(kuò)展到6路;

  • 微操作緩存從2304條增加到4096條;

  • 其他L1 BTB、L2 BTB等也有所提升。

Golden Cove的后端當(dāng)然也有提升,譬如重排序緩沖區(qū)、分支目標(biāo)緩沖區(qū)也有大概30%左右的提升,只是相對前端幅度不那么大。

Raptor Cove的微架構(gòu)與Golden Cove差異不大,表現(xiàn)在實(shí)際產(chǎn)品上主要是緩存的提升,如基于Raptor Coved的第13代酷睿(Raptor Lake)的每核心L2緩存從12代(Alder Lake)的1.25MB提升到2MB;第五代至強(qiáng)可擴(kuò)展處理器(Emerald Rapids)和第四代(Sapphire Rapids)每個核心的L2緩存都是2MB,但前者每個網(wǎng)格的末級緩存(Last Level Cache,也可繼續(xù)俗稱為L3緩存)從后者的1.875MB猛增到5MB。

Redwood Cove相對Golden Cove/ Raptor Cove的最重要變化是:

  • 指令緩存從32KB增加到了16路、64KB;

  • 微操作隊(duì)列從144個條目增加到192個條目;

  • 指令執(zhí)行延遲降低;

  • 更智能的預(yù)取和改進(jìn)的BPU;

  • L2緩存的帶寬有所提升;

  • AMX增加FP16支持。

當(dāng)然,Redwood Cove還有一個重大的優(yōu)勢就是“命好”,也就是前面提到的EUV制造工藝。但即使有革命性的制造工藝加持,至強(qiáng)6性能核也沒過分?jǐn)U張每個內(nèi)核的規(guī)模。就至強(qiáng)6性能核的內(nèi)核而言,每個網(wǎng)格節(jié)點(diǎn)是一個P核,每個P核配置私有的2MB L2緩存,以及共享的4MB 末級緩存。雖然平均到每個核的緩存容量并不比上一代至強(qiáng)(Emerald Rapids)多,但勝在總核數(shù)翻倍后。至強(qiáng)6性能核每個處理器可共享的末級緩存總?cè)萘恳琅f達(dá)到504MB,遠(yuǎn)超第五代的320MB和第四代的112.5MB。

在此也順便提一下至強(qiáng)6能效核的微架構(gòu)Crestmont。這個微架構(gòu)同樣出現(xiàn)在了酷睿Ultra的能效核當(dāng)中。Crestmont是2或4個內(nèi)核為一組共享L2緩存。在至強(qiáng)6能效核當(dāng)中,每2或4個內(nèi)核與4MB的L2緩存(在酷睿Ultra中則為2MB)構(gòu)成一個模塊,這幾個內(nèi)核共享頻率和電壓域。這個模塊對應(yīng)的網(wǎng)格還擁有可整個處理器全部內(nèi)核共享的3MB的末級緩存。換句話說,雖然至強(qiáng)6能效核的核數(shù)更多,但實(shí)際上網(wǎng)格規(guī)模比至強(qiáng)6性能核小。

能效核的指令緩存與性能核都是64KB,但數(shù)據(jù)緩存分別是32KB和48KB。前端的指令解碼器寬度也有差異,分別為6和8寬。指令亂序執(zhí)行引擎差異較大,能效核是256條而性能核是512條。能效核不支持性能核所支持的AVX-512和AMX,這也可以明顯減小矢量運(yùn)算單元的晶體管占用,但代價是每周期的單精度浮點(diǎn)運(yùn)算次數(shù)有了數(shù)量級的差異。但能效核也改進(jìn)了AVX2,增加了VNNI的INT8和BF16/FP16快速轉(zhuǎn)換,這樣在處理AI應(yīng)用的時候表現(xiàn)也還有所改善。另外,其256位加密和1024/2048密鑰也獲得了能效核的支持,確保至強(qiáng)6平臺的安全水平基本一致。

緩存規(guī)模、前端寬度以及矢量單元的差異,使得至強(qiáng)6性能核和能效核有不同的定位。早先發(fā)布的至強(qiáng)6能效核更適合微服務(wù)等運(yùn)算強(qiáng)度相對較輕,可在高核心數(shù)量和規(guī)模擴(kuò)展方面收益的任務(wù),以追求更高的能效、更高的機(jī)架利用率。而現(xiàn)在發(fā)布的至強(qiáng)6性能核更適合大數(shù)據(jù)、建模仿真等計(jì)算密集型和人工智能任務(wù),為高性能優(yōu)化,單顆處理器的功耗直飚500W——當(dāng)然,跟同期發(fā)布的Gaudi AI加速器的新品或類似的加速器產(chǎn)品相比,能耗是應(yīng)有的代價,有能力提升性能上限才是正經(jīng)事。

內(nèi)存性能大躍進(jìn)

內(nèi)存(DRAM)的數(shù)據(jù)存儲依賴電容,這個特點(diǎn)使其微縮和提速的難度大于晶體管。因此內(nèi)存并沒有沾摩爾定律的光,帶寬和密度的增長落后于CPU、GPU的發(fā)展。內(nèi)存帶寬滯后于CPU內(nèi)核數(shù)量的增長導(dǎo)致一個長期問題:平均每個內(nèi)核的內(nèi)存帶寬增長乏力,甚至出現(xiàn)倒退。譬如第三代至強(qiáng)可擴(kuò)展處理器內(nèi)核數(shù)28,內(nèi)存是八通道DDR4 3200,理論上的內(nèi)存總帶寬為205GB/s,平均每核7.3GB/s;四代是56或60核,內(nèi)存八通道DDR5 4800,總帶寬307GB/s,平均每核5.5GB/s;五代提升到DDR5 5600,內(nèi)核再增加到64,平均帶寬改進(jìn)甚微。第四、五代至強(qiáng)可擴(kuò)展處理器雖然引入了新一代的DDR5內(nèi)存,但由于內(nèi)核數(shù)量相對三代翻倍,內(nèi)存帶寬的增長幅度還是跟不上。同時期其他廠商的CPU核數(shù)在屢屢躍進(jìn)的過程當(dāng)中也存在同樣的問題。為了彌補(bǔ)內(nèi)存帶寬增長較慢的問題,第四代至強(qiáng)可擴(kuò)展處理器給部分用于科學(xué)計(jì)算的型號引入了HBM,五代則大幅度增加了末級緩存的容量,并支持CXL 2.0內(nèi)存擴(kuò)展。

在至強(qiáng)6900P上,內(nèi)存問題終于得到了比較好的解決。這涉及三個角度:

1.大容量末級緩存。前面提到過,6900P每個網(wǎng)格提供4MB L3,總?cè)萘窟_(dá)到了504MB,分別是四代的4.5倍、五代的1.6倍。而且,至強(qiáng)的全網(wǎng)格架構(gòu)使得任意內(nèi)核訪問末級緩存的延遲相比其他廠商的一些產(chǎn)品有更優(yōu)的表現(xiàn),例如不需要跨計(jì)算單元而造成延遲劇增。這種架構(gòu)效率更高的優(yōu)勢也是至強(qiáng)在核數(shù)曾落后的情況下還能打的有來有往的關(guān)鍵原因。

2.DDR5內(nèi)存雙管齊下提升帶寬。至強(qiáng)6900系列支持12通道DDR5 6400,總帶寬可以達(dá)到614GB/s,平均每核的帶寬大致還有5GB/s的水平。6900P還支持新型內(nèi)存MRDIMM,頻率提升至8800MT/s,總帶寬達(dá)到了845GB/s,平均每核6.6GB/s,也明顯超過了前兩代產(chǎn)品,大幅度逆轉(zhuǎn)了內(nèi)核數(shù)量增加、平均內(nèi)存帶寬不升反降的問題。

MR(Multiplexed Rank)DIMM打開了DDR內(nèi)存性能提升的新方向。DRAM通常由1到2個Rank組成,每個Rank的位寬為64位,如果考慮ECC,那就會有72或80位,但有效的數(shù)據(jù)是64位。消費(fèi)類內(nèi)存(UDIMM)可能只有1個Rank(顆粒數(shù)量較少的情況下),但追求大容量的服務(wù)器內(nèi)存(RDIMM)基本上都至少有2個Rank。在以往的內(nèi)存模式當(dāng)中,一次只讀取一個Rank的數(shù)據(jù),另一個Rank暫時閑置時可以做刷新操作,以保持?jǐn)?shù)據(jù)——這種輪流讀取、刷新Rank的特點(diǎn)延續(xù)了多年。MRDIMM設(shè)計(jì)了一個數(shù)據(jù)緩沖區(qū),通過將兩個內(nèi)存Rank分別讀入這個緩沖區(qū),再從緩沖區(qū)一次性傳輸?shù)紺PU的內(nèi)存控制器,由此實(shí)現(xiàn)了帶寬翻倍。第一代DDR5 MRDIMM的目標(biāo)速率為8800 MT/s,其實(shí)每個Rank只相當(dāng)于4400MT/s?,F(xiàn)在DDR5 6400已經(jīng)開始普及,因此MR DIMM的第二階段目標(biāo)是達(dá)到12800 MT/s,預(yù)計(jì)在2030年代的三代會提升至17600 MT/s。

3.CXL 內(nèi)存擴(kuò)展。第四代至強(qiáng)可擴(kuò)展處理器開始引入CXL支持,當(dāng)時是1.1版本,暫時也沒有公開支持Type 3設(shè)備(也就是CXL內(nèi)存)。從第五代開始正式引入了CXL 2.0,包括Type 3,可以幫助擴(kuò)展內(nèi)存容量和帶寬。在至強(qiáng)6上,CXL設(shè)備的應(yīng)用將更為普及,關(guān)鍵的CXL2.0標(biāo)準(zhǔn)設(shè)備,以及后向兼容的CXL1.1設(shè)備,預(yù)計(jì)都會陸續(xù)涌現(xiàn)。

這里重點(diǎn)說一下CXL內(nèi)存的優(yōu)勢。CXL2.0支持鏈路分叉,使一個主機(jī)端口可以對接多個設(shè)備,而且提供更強(qiáng)的CXL內(nèi)存分層支持,可實(shí)現(xiàn)容量和帶寬擴(kuò)展。至強(qiáng)6支持3種CXL內(nèi)存擴(kuò)展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

CXL Numa Node模式下,系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL擴(kuò)展內(nèi)存被視為兩個獨(dú)立的Numa節(jié)點(diǎn)進(jìn)行控制。每個Numa節(jié)點(diǎn)都有自己的內(nèi)存地址空間,系統(tǒng)軟件或應(yīng)用程序可以將任務(wù)分配到不同的Numa節(jié)點(diǎn),從而優(yōu)化內(nèi)存的使用。CXL Numa Node模式適用于需要精細(xì)內(nèi)存管理的應(yīng)用,可以通過操作系統(tǒng)、虛擬機(jī)管理程序(Hypervisor)或應(yīng)用程序本身來輔助分層管理內(nèi)存。

Hetero Interleaved(異構(gòu)交織)模式通過將系統(tǒng)的標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存混合在一起,形成一個統(tǒng)一的Numa節(jié)點(diǎn)。每個內(nèi)存地址空間中的數(shù)據(jù)可以交替存儲在DRAM和CXL內(nèi)存中,從而均衡內(nèi)存帶寬,減少延遲。異構(gòu)交織模式適用于對內(nèi)存帶寬有高需求的應(yīng)用,特別是當(dāng)需要將DRAM和CXL內(nèi)存結(jié)合使用時。此模式只有在配備性能核的至強(qiáng)6700P、6900P上才支持。假設(shè)將每顆至強(qiáng)6900P的64通道CXL用滿,可以額外增加256GB/s的內(nèi)存帶寬,單處理器就可以實(shí)現(xiàn)TB級的內(nèi)存帶寬,還是相當(dāng)可觀的。

Flat Memory(平面內(nèi)存)模式下,CXL內(nèi)存和標(biāo)準(zhǔn)內(nèi)存被視為單一的內(nèi)存層,操作系統(tǒng)可以直接訪問統(tǒng)一的內(nèi)存地址空間。硬件輔助的分層管理可以確保常用數(shù)據(jù)優(yōu)先存儲在標(biāo)準(zhǔn)內(nèi)存中,次要數(shù)據(jù)存儲在CXL內(nèi)存中,從而最大限度地提升內(nèi)存使用效率。平面內(nèi)存模式最大的價值在于無需修改軟件即可利用CXL內(nèi)存擴(kuò)展,而且這種模式適用于所有的至強(qiáng)6處理器。但平面內(nèi)存模式要求標(biāo)準(zhǔn)內(nèi)存和CXL內(nèi)存是1:1配置,這略為限制了硬件采辦、升級的靈活性。整體而言,平面內(nèi)存模式是至強(qiáng)6時期最易用、收效最直觀的模式,有望成為CXL內(nèi)存擴(kuò)展的主要模式。

踏上Chiplet異構(gòu)之路

至強(qiáng)6是至強(qiáng)家族首次將計(jì)算和IO芯片獨(dú)立,再通過Chiplet形式封裝在一起,總算是把高級封裝的優(yōu)勢真正發(fā)揮出來了。

第四代至強(qiáng)可擴(kuò)展處理器是英特爾的首個Chiplet設(shè)計(jì)的至強(qiáng)處理器。其XCC版本內(nèi)部是4顆芯片通過10組EMIB對等連接,每顆芯片提供15個內(nèi)核、2通道內(nèi)存控制器、1組加速單元,以及UPI、PCIe PHY若干。另外,還可以通過EMIB封裝4顆HBM。

第五代至強(qiáng)可擴(kuò)展處理器使用2顆芯片封裝而成,所使用的EMIB數(shù)量明顯減少,相應(yīng)地也節(jié)約了芯片面積。雖然內(nèi)核數(shù)量略有增加,但也損失了UPI、PCIe的數(shù)量,也不再能夠搭配HBM。

隨著制造工藝演進(jìn),偏重計(jì)算性能和晶體管密度的處理器內(nèi)核,與偏重高速信號互聯(lián)的IO控制器對制造工藝的要求產(chǎn)生了差異,因此,典型的Chiplet設(shè)計(jì)將計(jì)算和IO分離,分別應(yīng)用不同的制造工藝。英特爾在14代酷睿上便采用了這種方式,分為Compute Tile、SoC Tile、IO Tile、Graphic Tile。代號Ponte Vecchio的英特爾Data Center GPU Max利用Foveros和EMIB技術(shù),將47個小芯片封裝在一起,包括Compute Die、Base Die、Rambo、IO Die等。

至強(qiáng)6終于也拆分成計(jì)算單元(Compute Tile)和IO單元(IO Tile),分別由Intel 3和Intel 7工藝制造。

計(jì)算單元

根據(jù)收集到的信息,對于能效核,目前只出現(xiàn)了一種計(jì)算單元的設(shè)計(jì),每個單元最多提供144個內(nèi)核、4組內(nèi)存控制器共八通道;對于性能核,則是有三種計(jì)算單元的設(shè)計(jì),可分別用于組合高核數(shù)、中等核數(shù)、低核數(shù)的規(guī)格。

至強(qiáng)6900P使用了三個計(jì)算單元,每個單元43個內(nèi)核、兩個內(nèi)存控制器,總共構(gòu)成129個內(nèi)核(只使用128個)和12個內(nèi)存通道。這種計(jì)算單元姑且稱之為單元A,三個單元A構(gòu)成的處理器被稱為UCC。

未來發(fā)布的6700P核數(shù)跨度會很大,其中單路型號規(guī)劃為16~80核,多路型號為8~86核。單元A有4個內(nèi)存通道,兩個單元A組合可以提供最高86核,下限應(yīng)該不低于48核(否則屏蔽的內(nèi)核數(shù)量就實(shí)在太多,也太浪費(fèi)EMIB成本),這種規(guī)模的處理器被稱為XCC。48核以下的中等核數(shù)被稱為HCC,使用一種專門開發(fā)的單元B,每個單元提供48個內(nèi)核和4個內(nèi)存控制器。HCC核數(shù)的下限預(yù)計(jì)在24核左右。8和16核的6700P被稱為LCC,需要使用第三種單元C,16個內(nèi)核和4個內(nèi)存控制器。

通過使用3種計(jì)算單元進(jìn)行組合,至強(qiáng)6性能核可以構(gòu)建跨度從8~128核的、非常綿密的規(guī)格。也許會有人認(rèn)為,相比其他廠商只用一種規(guī)格計(jì)算單元實(shí)現(xiàn)擴(kuò)展的設(shè)計(jì),英特爾需要設(shè)計(jì)三顆不同的芯片的成本會更高。但我認(rèn)為,這是英特爾優(yōu)先考慮性能的結(jié)果。首先,至強(qiáng)6將內(nèi)存控制器安排在計(jì)算單元中,離內(nèi)核更近,延遲更低,即使因此犧牲了單元組合使用的靈活性也是值得的。其次,至強(qiáng)6性能核給不同規(guī)模的內(nèi)核數(shù)量規(guī)劃不同的網(wǎng)格規(guī)模,有利于降低核間的延遲,甚至,有可能LCC會針對較低的核數(shù)改用環(huán)形總線。綜上,預(yù)計(jì)至強(qiáng)6性能核相對同等規(guī)模的其他廠商的產(chǎn)品依舊可能會擁有內(nèi)存延遲低、緩存延遲低的優(yōu)勢。

IO單元

IO單元方面,至強(qiáng)6900、6700系列都使用2顆相同的IO芯片。每個IO芯片由2個IO模塊、4個UIO模塊、2個加速器模塊,以及IO網(wǎng)絡(luò)接口構(gòu)成。每個IO模塊提供x16 PCIe或CXL連接;每個UIO模塊提供x24 UPI2.0,或復(fù)用為x16的PCIe或CXL;每個加速器模塊提供DSA、IAA、QAT、DLB加速器各一個。

以這次發(fā)布的至強(qiáng)6900P為例,兩個IO單元總共提供8個UIO和4個IO模塊。其中6組UIO負(fù)責(zé)提供6個UPI2.0互連,剩余的2個UIO和4個IO模塊正好提供6×16=96通道的PCIe 5.0。雙路至強(qiáng)6900P的UPI不但速率高(24GT/s,高于五代的20GT/s和四代的16GT/s),連接數(shù)量也提升了50%。

對于還未發(fā)布、也是主力產(chǎn)品的至強(qiáng)6700系列,估計(jì)由于要使用規(guī)模較小的插座,只提供最多4組UPI用于多路的互聯(lián),PCIe通道也有所縮減。但即使如此,至強(qiáng)6700系列的單路型號在將所有UIO配置為PCIe之后,單插槽就可以提供多達(dá)136個PCIe通道,或64通道CXL。如果用單路至強(qiáng)6700配合半寬主板構(gòu)建雙節(jié)點(diǎn)服務(wù)器,那一個機(jī)箱內(nèi)的PCIe/CXL擴(kuò)展能力(272 /128)遠(yuǎn)遠(yuǎn)超過已知的任何雙路服務(wù)器。這種機(jī)箱可能會成為新的池化形態(tài),可以更高的密度提供NVMe存儲、CXL內(nèi)存、加速器等。

結(jié) 語

由于英特爾在14nm到10nm制造工藝的迭代過程遇到了一些問題,以致此前幾代至強(qiáng)平臺在“核戰(zhàn)”(比拼核數(shù))中略顯被動,但這個局面在至強(qiáng)6上有望完全逆轉(zhuǎn)。改良后的EUV制造工藝看來沒有束縛至強(qiáng)6的實(shí)力,核心數(shù)量、緩存容量、內(nèi)存帶寬等關(guān)鍵指標(biāo)全都進(jìn)入領(lǐng)先行列,一句話總結(jié)就是算力和存力的表現(xiàn)全部拉滿。至強(qiáng)6900P系列在各種項(xiàng)目的測試當(dāng)中,其代際性能提升就都是以倍數(shù)計(jì),而非百分之十幾、幾十的進(jìn)步。這種形勢也使得英特爾得以全面競爭科學(xué)計(jì)算、大數(shù)據(jù)、AI等領(lǐng)域的性能王座。

此外,至強(qiáng)6終于實(shí)現(xiàn)計(jì)算與IO的解耦,也讓至強(qiáng)6及未來的產(chǎn)品線走上了正確、靈活的道路,得以充分發(fā)揮Chiplet的優(yōu)勢。將Chiplet視作降低成本、提高良率的手段是狹隘的。Chiplet的價值在于靈活、復(fù)用、重構(gòu)。英特爾長期以來很注重細(xì)分市場的耕耘,產(chǎn)品線非常復(fù)雜,正確利用Chiplet可以達(dá)到事半功倍的效果。我們非常期待至強(qiáng)6后續(xù)產(chǎn)品的陸續(xù)發(fā)布能夠給業(yè)界帶來什么樣的想象力。

點(diǎn)贊()
上一條:延遲退休不焦慮!用芳華未來app快樂養(yǎng)生,安享健康晚年2024-09-27
下一條:聯(lián)通情,人心通:一線服務(wù)者的溫暖傳遞2024-09-27

相關(guān)稿件

增加算力供給 上海臨港算力產(chǎn)業(yè)規(guī)模指向百億級 2023-06-03
AI催生算力需求爆發(fā) 算網(wǎng)“高速路”加快鋪就 2023-08-21
湖南著力建設(shè)全國先進(jìn)綠色算力樞紐 2023-09-18
工信部多舉措夯實(shí)數(shù)字經(jīng)濟(jì)“算力底座” 2022-06-30
打造長三角算力產(chǎn)業(yè)新坐標(biāo) 2022-02-23
國務(wù)院國有資產(chǎn)管理委員會 中國企業(yè)聯(lián)合會 中國企業(yè)報 中國社會經(jīng)濟(jì)網(wǎng) 中國國際電子商務(wù)網(wǎng) 新浪財(cái)經(jīng) 鳳凰財(cái)經(jīng) 中國報告基地 企業(yè)社會責(zé)任中國網(wǎng) 杭州網(wǎng) 中國產(chǎn)經(jīng)新聞網(wǎng) 環(huán)球企業(yè)家 華北新聞網(wǎng) 和諧中國網(wǎng) 天機(jī)網(wǎng) 中貿(mào)網(wǎng) 湖南經(jīng)濟(jì)新聞網(wǎng) 翼牛網(wǎng) 東莞二手房 中國經(jīng)濟(jì)網(wǎng) 中國企業(yè)網(wǎng)黃金展位頻道 硅谷網(wǎng) 東方經(jīng)濟(jì)網(wǎng) 華訊財(cái)經(jīng) 網(wǎng)站目錄 全景網(wǎng) 中南網(wǎng) 美通社 大佳網(wǎng) 火爆網(wǎng) 跨考研招網(wǎng) 當(dāng)代金融家雜志 借貸撮合網(wǎng) 大公財(cái)經(jīng) 誠搜網(wǎng) 中國鋼鐵現(xiàn)貨網(wǎng) 證券之星 融易在線 2014世界杯 中華魂網(wǎng) 納稅人俱樂部 慧業(yè)網(wǎng) 商界網(wǎng) 品牌家 中國國資報道 金融界 中國農(nóng)業(yè)新聞網(wǎng) 中國招商聯(lián)盟 和訊股票 經(jīng)濟(jì)網(wǎng) 中國數(shù)據(jù)分析行業(yè)網(wǎng) 中國報道網(wǎng) 九州新聞網(wǎng) 投資界 北京科技創(chuàng)新企業(yè)誠信聯(lián)盟網(wǎng) 中國白銀網(wǎng) 炣燃科技 中企媒資網(wǎng) 中國石油化工集團(tuán) 中國保利集團(tuán)公司 東風(fēng)汽車公司 中國化工集團(tuán)公司 中國電信集團(tuán)公司 華為技術(shù)有限公司 廈門銀鷺食品有限公司 中國恒天集團(tuán)有限公司 濱州東方地毯集團(tuán)有限公司 大唐電信科技股份有限公司 中國誠通控股集團(tuán)有限公司 喜來健醫(yī)療器械有限公司 中國能源建設(shè)股份有限公司 內(nèi)蒙古伊利實(shí)業(yè)集團(tuán)股份有限公司 中國移動通信集團(tuán)公司 中國化工集團(tuán)公司 貴州茅臺酒股份有限公司