5月底的線程先競臺北電腦展期間,AMD正式發(fā)布了基于全新Zen5架構(gòu)的撕裂銳龍線程撕裂者9000系列處理器,包括面向工作站的入揭撕裂者PRO 9000WX系列、面向發(fā)燒級桌面的秘領(lǐng)撕裂者9000系列。
近日,品最文Q參加了AMD在美國加州圣何塞舉辦的多%大金Advancing AI 2025。
期間,剛護(hù)AMD不但發(fā)布了Instinct MI350系列AI加速卡、線程先競ROCm 7開發(fā)平臺,撕裂還解讀了撕裂者9000系列處理器、入揭Radeon AI PRO顯卡的秘領(lǐng)架構(gòu)、技術(shù)細(xì)節(jié),品最現(xiàn)在分享給大家。多%大金
同時,剛護(hù)四大OEM伙伴也聯(lián)合展示了各家的線程先競新品。
先感受下192個框框齊頭并進(jìn)的壓迫感:
【大殺四方的撕裂者9000系列】
故事還要從一個特殊品類的計算機(jī)說起——工作站。
工作站定位介于服務(wù)器與個人PC之間,又稱圖形工作站,一般采用高性能、高可靠性的專業(yè)級處理器、顯卡、內(nèi)存、主板等配件,主要用于圖形渲染、2D/3D設(shè)計、視頻編輯、游戲開發(fā)、AI加速等工作,在設(shè)計與制造(DM)、建筑工程與施工(AEC)、媒體與娛樂(ME)、軟件與科學(xué)等領(lǐng)域發(fā)揮著不可替代的作用。
它可以是一臺塔式臺式機(jī),可以是一臺筆記本,也可以是一臺服務(wù)器,形式多樣。
工作站市場雖然不算很龐大,但相當(dāng)穩(wěn)定,而且一直在穩(wěn)定增長。
IDC數(shù)據(jù)顯示,2024年,全球工作站市場規(guī)模接近700萬臺,而預(yù)計到了2029年,將增長至約900萬臺。
AMD一直有著完善、強(qiáng)大的工作站產(chǎn)品線,尤其是各種高性能處理器,從移動端的銳龍AI PRO系列到桌面級的銳龍PRO、銳龍線程撕裂者PRO系列,再打當(dāng)Radeon RRO、Radeon AI PRO系列顯卡,構(gòu)成了完整的平臺方案。
尤其是撕裂者處理器,2017年誕生以來一直大殺四方,沒有任何對手,比如最新的撕裂者PRO 7995WX,多線程性能相比至強(qiáng)W9-3595X領(lǐng)先多達(dá)80%。
即便如此,撕裂者系列也一直在飛速進(jìn)步,比如Zen4架構(gòu)的撕裂者PRO 7995WX對比Zen初代架構(gòu)的撕裂者1950X,只用短短6年時間,架構(gòu)進(jìn)化了四代,制造工藝從14nm到5nm,核心數(shù)增長了6倍(從16核心到96核心),緩存增長了12倍(從40MB到480MB),內(nèi)存帶寬增長了4倍(從四通道DDR4-2666到八通道DDR5-5200),PCIe帶寬增長了4倍(從PCIe 3.0到PCIe 5.0)。
當(dāng)然了,對于專業(yè)應(yīng)用來說,只有強(qiáng)大的硬件性能是遠(yuǎn)遠(yuǎn)不夠的,更需要成熟的生態(tài)應(yīng)用的配合。
經(jīng)過多年發(fā)展,AMD撕裂者系列已經(jīng)得到了行業(yè)的普遍支持,各種專業(yè)軟件都做了非常好的優(yōu)化適配,可充分發(fā)揮其多核心、大緩存、豐富I/O等諸多方面的獨(dú)特優(yōu)勢。
最新的撕裂者9000系列最核心的變化就是升級到最新的Zen5架構(gòu),同樣可以享受單線程與多線程性能大幅提升、計算負(fù)載全流水線優(yōu)化、512位數(shù)據(jù)路徑AVX-512指令集、增強(qiáng)ISA指令能力、DDR5-6400內(nèi)存支持、更高能效等提升。
關(guān)于Zen5架構(gòu)的細(xì)節(jié)變化,我們之前已經(jīng)做過詳細(xì)解讀,這里不再贅述,只需注意幾個關(guān)鍵點(diǎn):整數(shù)ALU單元增至6個以提升處理能力、新一代分支預(yù)測精度更高、一級指令緩存拾取容量翻番、一級數(shù)據(jù)緩存容量增大一半至48KB并支持12路關(guān)聯(lián)、op-cache緩存每時鐘周期拾取寬度翻番至6個,等等。
一如既往,撕裂者9000系列的chiplets整合封裝更類似EPYC 9005系列,內(nèi)置最多12個4nm工藝的CCD、1個IOD,每個CCD最多8核心,因此最多就是96核心192線程,沒有集成GPU圖形核心。
這是Zen5架構(gòu)單個核心與整體的緩存體系。
單個核心內(nèi),一級指令緩存保持32KB 8路關(guān)聯(lián)不變,拾取寬度翻倍;一級數(shù)據(jù)緩存提升50%而達(dá)到48KB 12路關(guān)聯(lián),支持512b 4個載入和2個存儲;一二級緩存之間數(shù)據(jù)路徑,每時鐘周期64字節(jié);二級緩存帶寬翻倍;三級緩存延遲更低。
每核心1MB二級緩存,每個CCD 8MB二級緩存,所有核心共享32MB三級緩存。
因此,整顆處理器最多96MB二級緩存、384MB三級緩存,合計480MB緩存。
更高的能效也是Zen5架構(gòu)的一大亮點(diǎn),包括提升分支預(yù)測精度以工作量并顯著降低“錯誤路徑”的功耗開銷、提升同步多線程的效率以改善單位面積功耗、繼續(xù)改進(jìn)功耗柵極、縮短電源狀態(tài)的切換時間。
得益于更高的能效,Zen5架構(gòu)可以在同等功耗之下,達(dá)到更高的性能水平。
按照官方說法,Zen5對比Zen4,在10個工作站基準(zhǔn)測試中平均IPC提升幅度為16%,SPEC AI/ML平均IPC提升幅度更是達(dá)到了25%。
再加上略微高了一點(diǎn)的頻率……
撕裂者9000系列的主要特性,其中棕色字體是新的變化。
內(nèi)存支持還是8通道,但頻率從DDR5-5200提高到DDR5-6400,理論峰值帶寬410GB/s,并且支持EXPO一鍵超頻,最高能超到DDR5-7000+。
PCIe通道雖然沒變,但是通過優(yōu)化內(nèi)部SoC拓?fù)浣Y(jié)構(gòu),提升了有效帶寬。
繼續(xù)兼容sTR5平臺,現(xiàn)有主板無需更換。
AMD PRO特性升級,支持AIM-T無線網(wǎng)絡(luò)。
撕裂者PRO 9000WX系列型號規(guī)格一覽表,一共六款,和上代一一對應(yīng):
9995WX 96核心、9985WX 64核心、9975WX 32核心、9965WX 24核心、9955WX 16核心、9945WX 12核心。
對應(yīng)型號的基準(zhǔn)頻率、三級緩存也保持完全一致,加速頻率統(tǒng)一從5.3GHz提高到5.4GHz,熱設(shè)計功耗仍舊都是350W。
撕裂者9000系列型號、規(guī)格一覽表,一共三款,同樣和上代一一對應(yīng),仍然沒有96核心:
9980X 64核心、9970X 32核心、9960X 24核心。
基準(zhǔn)頻率、三級緩存也是和對應(yīng)型號保持不變,加速頻率也是從5.3GHz提高到5.4GHz,熱設(shè)計功耗還都是350W。
相比于專業(yè)的撕裂者PRO 9000系列,面向桌面的撕裂者9000系列內(nèi)存降級為4通道,PCIe 5.0通道減少到80條,去掉了AMD PRO管理特性。
二者都支持超頻,但是PRO版本基本不會開放。
另外,撕裂者9000 PRO處理器可以安裝在TRX50主板上,但是撕裂者9000系列處理器不能安裝在專業(yè)的WRX90主板上。
兩代旗艦之間,PRO 9995WX對比PRO 7955WX,在不同實際負(fù)載中的性能提升幅度都非??捎^,至少也有13%,最高達(dá)到了26%,這都是Zen5架構(gòu)的功勞。
PRO 9995WX對比友商最好的工作站處理器至強(qiáng)W9-3595X(60核心120線程),那就是妥妥的全程碾壓了,尤其是在CPU敏感型應(yīng)用中,可以輕松取得超過1倍的領(lǐng)先優(yōu)勢。
即便是在同時需要CPU+GPU的負(fù)載中,同樣是全面大幅領(lǐng)先。
面對最新的AI工作負(fù)載,無論是大模型tokens生成速度,還是文生圖速度,又或者創(chuàng)作,PRO 9995WX同樣把競品殺得落花流水。
64核心的非專業(yè)級9980X,都是至強(qiáng)W9-3595X無法仰望的存在,至少也可以輕松領(lǐng)先20%以上,最高甚至達(dá)到了108%。
本文來源:http://www.iv82.cn/news/89c32999581.html
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容,請發(fā)送郵件舉報,一經(jīng)查實,本站將立刻刪除。