-
前言:“甜品”乏力,準旗艦成為性價比新寵
眾所周知,今年整個PC顯卡市場的情況多少有點不同尋常。
一方面在技術上,今年無論AMD、還是NVIDIA的新架構,性能相比前代都絕對是全方位的提升,並且它們不再像前代或前前代產品那樣,單純只注重浮點性能或光追處理能力,而是依託於大幅進步的製程,塞進了遠比過去大得多的流處理器規模。
但另一方面在市場策略上,今年頂級旗艦顯卡與“非旗艦產品”之間規格差距過大的事實,也使得不少遊戲玩家感到有些難以接受。特別是由於這樣的產品構成,也導致以往一向被認為性能適中、價格親民的“甜品”級中端顯卡,今年實際上已經消失了的事實,更是令一些預算並不那麼充足的朋友有些心塞。
不過新架構的巨大提升畢竟還是擺在這裡,所以對於消費者而言,現階段如果還去購買前代架構的產品,顯然就是有些過於不理智的行為。於是乎,在對市場中現有產品進行了綜合比較後,不少朋友都發現,今年A/N兩家產品線的“準旗艦”型號,似乎反而成為了在性能、價格等各方面都最能令人滿意的選擇。
那麼問題就來了,AMD的Radeon RX7900 GRE和NVIDIA的RTX4070,這兩款時下同樣高人氣的準旗艦產品,它們之間到底有哪些不同,實測性能上又有怎樣的差異呢?抱著這樣的好奇心,我們三易生活也進行了一次對比測試。
-
規格對比:不只是一大一小,更是兩種不同的產品思路
首先我們基於目前已知的公開數據,總結出了RX7900 GRE和RTX4070這兩款產品的技術參數對比表格。
雖然這兩款顯卡在各自“陣營”都算是準旗艦,但從它們的芯片面積和晶體管數量便不難發現,兩者的基本思路其實大相徑庭。
其中,RX7900 GRE很明顯是一顆“大芯片”。它使用了與RX7900 XTX相同的Navi31核心,圖形計算部分(GCD)的規模與“滿血版”Navi31相比,僅僅只減少了不到20%。定位差異主要靠的是從6單元砍到4單元,位寬和緩存都減少了1/3的顯存控制器(MCD)來實現。
相比之下,RTX4070所使用的AD104核心,與其對應的同代旗艦AD102(RTX4090)之間的差異就太大了。它的晶體管數量和麵積都不到AD102的一半,流處理器數量更是比“滿血版”AD102的1/3還要少。相比之下,閹割程度“僅有”50%的顯存控制器,反而可能是RTX4070相比於現款旗艦差異最小的部分。
在這樣的前提下,當我們將視線聚焦到這兩款顯卡的圖形和算力指標上時,它們之間的差別自然也就並不那麼令人驚訝。可以看到,RX7900 GRE無論是在最傳統的紋理、像素生成性能,還是在更偏現代遊戲的浮點算力指標上,都比RTX4070高出了50%以上,甚至在某些項目上的領先幅度達到了100%。
DLSS3以及AI加速能力讓RTX40系顯卡至今溢價較高
但即便如此,從實際的市場價格來看,RTX4070卻往往並沒有比RX7900 GRE便宜很多。這當然也有不同品牌定價策略差異的因素,但還有一個原因,就在於RTX4070靠著那184顆張量單元+光流加速器所提供的算力,以及DLSS 3這個不容忽視的幀率暴增利器。甚至從某種意義上來說,如果不是因為DLSS3,或者是在不支持DLSS的遊戲裡,那麼RTX4070的性能和定價很有可能會“判若兩卡”。
當然,有的朋友朋友可能會說,AMD也有FSR2。沒錯,所以關於這兩張顯卡的對比,肯定不能只停留在理論算力和規模的層面。實際的跑分以及遊戲中原生和非原生分辨率(即開啟DLSS或FSR)情況下的性能表現,都需要進行考察。
-
技術分析:同為DX12.2顯卡,但側重點卻有微妙差異
此次我們三易生活找來的兩張顯卡,其中一張是此前測試過的公版AMD Radeon RX7900 GRE,另一張則是一款相對常見、某品牌的通路RTX4070。
首先,用GPU-Z驗明正身。必須要說明的是,截止目前最新版(2.54)的GPU-Z仍不支持顯示RX7900 GRE的頻率。不過從它的VBIOS信息裡可以清楚看到“Navi31 XL”的字段,這也印證了我們前文中所提及,RX7900 GRE與RX7900 XTX源自同一個GPU核心的結論。
相比之下,RTX4070的GPU-Z信息更明確一些。可以看到它的流處理器數量、頻率信息,以及BIOS裡的功率牆情況。
有的朋友可能已經注意到了,我們找來的這款RTX4070核心頻率比起純公版的數值,有幾十MHz的小幅度超頻。不過這其實並不太會影響到最終的測試結果,因為只要看過我們三易生活此前的相關內容就會知道,如今顯卡在遊戲中的實際頻率,其實早就不受到多大出廠主頻的影響了。
此外,我們也對比了RX7900 GRE和RTX4070針對DirectX 12 API的具體支持情況。可以看到,兩者在具體的API兼容性上,其實是存在區別的。
左側為RX7900 GRE,右側為RTX4070
比如說,RX7900 GRE擁有比RTX4070更高的操作位深(44bit對40bit),但在可變渲染率API的項目中缺少對於額外渲染率的兼容性,且其屏幕空間分區的數量也較少(8*8分區對16*16分區)。
左側為RX7900 GRE,右側為RTX4070
又比如說,RX7900 GRE具備更多的緩存相關API,它支持將內存、硬盤作為紋理緩存,而RTX4070則不具備這些功能。
左側為RX7900 GRE,右側為RTX4070
除此之外,在DX12的視圖實例化功能級別上,兩家顯卡也選擇了不同的技術級別(Tier),而且它們的可寫入操作指令也有所區別,AMD的要多一條複製操作。
左側為RX7900 GRE,右側為RTX4070
最後,RX7900 GRE默認不支持D3D12的後臺處理特性,而RTX4070則具備此API。
於是乎,這些差異意味著什麼呢?簡單來說,NVIDA的準旗艦顯卡似乎更擅長於在畫面處理、著色器優化等方面進行“減負”,從而提高最終的幀率。而相比之下,AMD在畫面相關的API上要更加“老實”,更接近於靠顯卡本身的紋理和頂點生成能力去“硬算”。
但與此同時,或許是出自遊戲主機業務的經驗,也使得AMD會更重視GPU與內存、SSD、以及多核CPU之間的聯動效應。換句話說,雖然名義上大家都用的同一套API,但實際上在技術實現方式上,AN兩家還是有著不小差異的,而且這種差異,也能讓人看到兩家品牌對於如今遊戲技術、PC硬件業務有趣的理解區別。
-
實測對比:一個光柵性能強、另一個幀率花樣多
聊完了技術標準上的差異,接下來我們進入跑分階段。首先需要說明的是,為了確保電腦裡的其他部分不會成為此次對比的瓶頸,我們使用了一套銳龍9-7950X搭配360水冷的平臺,並配以32GB的DDR5-6000MHz內存。系統為Windows 11專業工作站版本,所有測試軟件和遊戲也均安裝在PCIE 4.0的旗艦級SSD中以消除IO瓶頸。
首先是3DMARK的光追測試,RX7900 GRE和RTX4070在這個環節裡的得分幾乎沒有什麼差異。
不過在更“傳統”、比拼純粹光柵能力的Time Spy Extreme項目裡,兩者的差距就比較大了。可以看到,RX7900 GRE以超過13.1%的優勢領先於RTX4070。
接下來,進入遊戲測試環節。在《街霸6》這樣相對低負載的遊戲裡,兩款準旗艦顯卡都能毫無壓力的拿到滿分。
換成《使命召喚:現代戰爭2(2022)》,兩張顯卡之間的差距就拉開了。當我們在2K分辨率下將所有的畫面、光照選項全部拉到最高,同時關閉一切超分算法(包括FSR、DLSS、XESS等)時,RX7900 GRE的最低幀率依然能夠高於80FPS、同時平均幀率超過144FPS,而RTX4070的最低幀率已經不足60FPS、平均幀也僅有110FPS。
而在打開了畫面超分功能,在RX7900 GRE上開啟FSR2.2、RTX4070上開啟DLSS後可以看到,兩者都獲得了可觀的幀率增益。它們的幀率分別增加了33.8%(RX7900 GRE)和38.1%(RTX4070),也算得上是不相上下。
接下來在《古墓麗影·暗影》裡,同樣是2K分辨率、所有能開的畫質選項全部拉滿。這一次儘管兩者的平均幀率都遠超60FPS,但RTX4070的平均幀率比RX790 GRE高出了約9.2%。
最後,我們用代表高負載遊戲的《賽博朋克2077》對兩者進行了測試。在2K分辨率、全部畫質選項拉滿、光追級別開到“變態”的情況下,即便不啟用更耗性能的“路徑追蹤”技術,兩張顯卡就都已經力不從心、無法維持足夠流暢的幀率了。
在將光追級別下降到“超級”,同時在A卡上開啟FSR2.1、N卡上開啟DLSS2,並將銳化級別都設置為“自動”後。此時兩張顯卡的表現就流暢了很多,它們的平均幀率上漲幅度均超過了100%,這也表明《賽博朋克2077》對各兩家的遊戲超分都有著不錯的支持力度。
當然,對於RTX40系的N卡來說,因為具備額外的光流加速器,所以RTX4070還可以通過打開幀生成(也就是插幀)功能,來進一步提高幀率。這也不得不讓人感嘆,如今N卡在提升幀率的技巧方面確實花樣更多。
-
總結:雖然側重點各有不同,但“戰未來”總歸不會錯
測了這麼多項目後,那麼RX7900 GRE和RTX4070這兩張準旗艦顯卡到底應該怎麼選呢?
總的來說,無論從芯片規模、設計理念,還是“原始的”光柵性能來看,RX7900 GRE實際上都是要壓倒RTX4070的,也可以說是沒後者那麼“取巧”。當然,這也帶來了更大的供電規模以及更高一點點的功耗,不過考慮到這個級別的顯卡也超不過300W,所以我們並不認為現在存在帶不動這兩張顯卡的PC,因此功耗顯然並不是關鍵。
關鍵的問題在於,這兩張顯卡一個重視絕對算力和光柵性能,另一個則更重視光線追蹤和AI優化。這種思路差異就意味著,如果你平時玩的是一些“重光追”,且普遍對N卡、特別是對DLSS3優化更好的遊戲(比如《賽博朋克2077》這類),那麼“輕量級”的RTX4070反倒會有更高的絕對幀率表現。
但只要你不是經常玩這類重光追、重後期AI超分的遊戲,那麼在傳統的光柵化3D遊戲裡,絕對顯示性能更高、浮點算力更強的RX7900 GRE,則會反過來具備更顯著的性能優勢。特別是那些不“吃”AI優化,甚至也不依賴浮點算力的經典遊戲,更是如此。
況且稍有經驗的玩家想必都知道,長期的性能優化和遊戲適配一直以來都是AMD更勝一籌的優勢所在。因此RTX4070在光追、優化上的優勢,其實從長遠來看或許也就沒有那麼大了。
視頻|一加Ace2 Pro評測:突破性能上限,重新定義滿配體驗
不只有頂尖性能,更強調了一加的核心競爭力。