一、神跡X首前言:脫胎換骨的重現(xiàn)RDNA 4架構(gòu)
實(shí)在不知道該如何評(píng)價(jià)NVIDIA的RTX 50系列顯卡!
Blackwell架構(gòu)的發(fā)評(píng)變化如此之小,除了增加了PCIe 5.0和DLSS 4技術(shù)之外,測(cè)性似乎就再?zèng)]有其他顯著的但便改進(jìn)。
就連制程工藝依舊是宜元2年前的臺(tái)積電4N(實(shí)際上是5nm),晶體管密度沒有任何提升,神跡X首完全是重現(xiàn)依賴成熟的制程工藝所帶來的超高頻率以及GDDR7顯存來實(shí)現(xiàn)性能提升。
在相同的發(fā)評(píng)價(jià)位上,RTX 50相比上代僅有區(qū)區(qū)15%的測(cè)性性能提升!而即便如此,但便消費(fèi)者也幾乎不可能以MSRP原價(jià)買到RTX 5070 Ti和RTX 5080,宜元基本上都要加價(jià)千元以上。神跡X首
所以整整2年的重現(xiàn)等待,玩家到底等到了什么!發(fā)評(píng)
NVIDIA站在山巔毫無對(duì)手,肆意揮霍著RTX 40系帶來的巨大領(lǐng)先優(yōu)勢(shì),擠牙膏程度比起10年前的Intel有過之而無不及!
AMD這邊一直隱忍不發(fā),將RX 9070系列的解禁日期放在了今天,而它將是HD 4850之后最為成功的GPU產(chǎn)品。
經(jīng)歷了RDNA 3的挫折之后,AMD對(duì)RDNA 4從最底層開始進(jìn)行了改頭換面般的革新。
RDNA 4采用了DCU(Dual Compute Unit)設(shè)計(jì),一個(gè)DCU包含上下并行的2個(gè)CU單元,而每個(gè)CU單元又包含2組SIMD32矢量單元,這在一定程度上可以帶來更高的并行效率。
RDNA 4的每組SIMD32單元中包含32個(gè)可同時(shí)處理整數(shù)、浮點(diǎn)運(yùn)算的FMA/INT ALU、32個(gè)只能處理浮點(diǎn)運(yùn)算的FMA ALU。
在極限狀態(tài)下,所有的ALU單元都進(jìn)行浮點(diǎn)運(yùn)算時(shí),每組SIMD32矢量單元相當(dāng)于有64個(gè)流處理器,也就是每個(gè)CU有128個(gè)流處理器。
但是,AMD和NVIDIA不同,沒有將FMA/INT單元算作流處理器,也許是AMD對(duì)于數(shù)字并沒有太在意。
為了解決流處理器數(shù)量倍增所帶來的調(diào)度問題,AMD擴(kuò)展了標(biāo)量單元(Scalar Unit)的指令集,能支持新的Float32 操作。
同時(shí)還引入了動(dòng)態(tài)寄存器分配技術(shù),使得顯卡在處理復(fù)雜圖形任務(wù)時(shí)能夠更靈活地調(diào)度資源,基本上不會(huì)出現(xiàn)RDNA 3上的4個(gè)Wave競(jìng)爭(zhēng)一個(gè)標(biāo)量ALU的情況。
在內(nèi)存效率方面,AMD做了2點(diǎn):翻倍的L2緩存容量,無序內(nèi)存處理技術(shù)!
以上是RDNA 3、RDNA 4兩代架構(gòu)圖,可以看到RX 7900 XT配備了6MB二級(jí)緩存,RX 7800 XT則是4MB二級(jí)緩存。
RNDA 4將更多的晶體管用了二級(jí)緩存上面,RX 9070 XT和RX 9070都擁有8MB二級(jí)緩存,兩倍于上代產(chǎn)品。更大的二級(jí)緩存有助于提升命中率,能讓GPU減少直接訪問顯存的幾率,。
同時(shí)AMD還推出了無序內(nèi)存處理技術(shù)。
在RDNA 3中,來自不同著色器的內(nèi)存請(qǐng)求是按順序處理的,這可能導(dǎo)致延遲并影響性能。
RDNA 4允許這些請(qǐng)求無序執(zhí)行,也就是說有需求的請(qǐng)求無需等待、直接處理,相當(dāng)程度上優(yōu)化了數(shù)據(jù)訪問效率。
RX 9070 XT還擁有64MB Infinity Cache,雖然容量沒有變化,但在運(yùn)行頻率、帶寬以及訪問延遲方面都有提升。
以上這些技術(shù)足以讓256Bit 20Gbps顯存的RX 9070 XT,在4K游戲性能上匹敵384Bit 20Gbps顯存的RX 7900 XTX和256Bit 28Gbps顯存的RTX 5070 Ti。
光追加速器則升級(jí)為第三代,包括一個(gè)光線加速器、一個(gè)光線轉(zhuǎn)換引擎、兩個(gè)光線交叉引擎、一個(gè)遍歷堆棧管理單元等等,顯然和NVIDIA走的完全不同的思路。
AMD宣稱,通過增加一個(gè)光線交叉引擎,以及支持更先進(jìn)的光追技術(shù),RDNA 4每個(gè)CU單元的光追吞吐量都翻了一倍。
至于實(shí)際光追效果如何,后面的測(cè)試見分曉。
AMD Radeon RX 9070 & 9070 XT規(guī)格參數(shù)如下:
RX 9070 XT一共有64組RDNA 4構(gòu)架的CU單元,總共4096個(gè)流處理器,當(dāng)然如果像NV那樣把FMA/INT單元也算成流處理器的話,那就是8192個(gè)流處理器了。
另外,制程工藝也從臺(tái)積電5+6nm升級(jí)到了4nm,僅僅357mm2的面積就集成了539億個(gè)晶體管,晶體管密度提升36%。
這里再說一下,NVIDIA新一代RTX 50系列的晶體管密度對(duì)比RTX 40沒有任何提升。
本文來源:http://www.iv82.cn/news/69c9699834.html
版權(quán)聲明:本文內(nèi)容由互聯(lián)網(wǎng)用戶自發(fā)貢獻(xiàn),該文觀點(diǎn)僅代表作者本人。本站僅提供信息存儲(chǔ)空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權(quán)/違法違規(guī)的內(nèi)容,請(qǐng)發(fā)送郵件舉報(bào),一經(jīng)查實(shí),本站將立刻刪除。