前言
時間一翻,我們迎來RTX 4070顯卡的發佈。就這樣顯卡來說,本身70是一個比較中端的數字,但是也不知道最近通貨膨脹比較厲害還是怎麼滴,我第一次對70這個數字感到壓力大。也許這就是如今市場的特點吧。
NVIDIA AD104-250-A1 構架解析
硬件改進:
上圖就是RTX 4070的核心圖。和相比於RTX 4070 Ti,又閹割了一個GPC。而RTX 4070本身定位是要追擊RTX 3070 Ti,甚至要打RTX 3080的。所以我們就以RTX 3070 Ti來對比,兩者規格如下:
-
5888個CUDAs(上一代為6144,↓4.2%)
-
64ROPs(上一代為96,↓33.3%)
-
184TMUs(上一代為192,↓4.2%)
-
46RTCores(上一代為48,↓4.2%)
-
184TensorCores(上一代為192,↓4.2%)
剩下的內容,和RTX 4070 Ti差不多的,因此如果看過的話可以跳到顯卡一覽了。
GPC在結構上並沒有太大的變化,主要還是在一些小SM內做了改進。如第三代RTCore,第四代TensorCore,完整支持第八代NVENC AV1的雙解碼器等技術。
第三代 RT Core 的新計算特性這裡就不多說了。提升主要來自算法上的優化。他們總共提出了三個主要的提升。總結下來就是三點:
-
光追單元變多,並針對不同的光追運算指令進行重排序,提升運算效率
-
通過增加透明度的定義,減少光線與物體三角形求交的無效計算,提升運算效率(大白話既光追看不見的地方交給傳統光柵單元算)
-
通過增加位移信息簡化複雜物體的構建成本,顯著降低光線追蹤運算的硬件資源消耗(大白話既光追看得出來的地方少算)
第四代 TensorCore 單元的變化主要是集成了FP8計算單元,實現了最高1.3PFlops的計算性能。
除了構架上的小幅改進,Ada構架也把製程進一步提升到了TSMC 4NNVIDIA定製工藝。使得AD102在與GA102面積相當,甚至更小的情況下擁有76.3B的晶體管數量,是原來2.69倍。
軟件改進:
DLSS 3是隨著Ada構架推出的新功能。過去大家對DLSS的評價褒貶不一,主要原因在於雖然DLSS提升性能,但是所帶來的畫面撕裂與模糊感非常強烈。新的DLSS 3除了保留了DLSS 2的功能外還引入了類似傳統幀生成的優化方法。這種方法的好壞不做評價。但是如果能讓遊戲從PPT變成電影,那也無法否認其存在價值。
考慮到未來4K遊戲的發展,高刷4K會漸漸變成主流。目前來說越來越多遊戲開始支持DLSS,而支持DLSS 3遊戲也會漸漸增加。希望這個技術能真成為高刷高分辨率的一個解決方法。
顯卡一覽
老三樣,附贈了一根12+4 Pin轉2個8Pin的轉接線。
顯卡的靜電封袋很有想法,不再是短邊開口,長邊開口更方便拿取收納。
今年的七彩虹顯卡都採用方方正正的設計,而Ultra都配上了這種閃閃的貼紙,看起來還是不錯的。如果能往裡面加點燈條隱隱約約從貼紙內透出就更好了。
4070 Ultra的PCI-E擋板是3個,散熱器也是3個。顯示接口方面吧和上一代沒差,3DP 1.4+1HDMI 2.1設計,還有一個一鍵核爆按鈕。
12+4Pin接口,RTX 4070 的功耗為220W TGP。還有一個採用傳統8Pin的低功耗版是200W。
一些小細節,其實沒啥了。
分體一覽。
風扇是GTECOTHERM GFY10015H12BPA,散熱規格12V 0.5A。
4070 Ultra的散熱規格,6熱管散熱。6跟熱管延伸至散熱後部,2跟延伸至前部。鱗片的面積其實可以不做成三槽的,但是為了拉風。
Geforce RTX 4070 Ultra PCB完整照片。供電規格也沒有什麼稀奇,8+3相供電,uPI uP9512+萬代AOZ5311NQI 55A級一體MOS負責核心供電,uPI uP9529Q+萬代AOZ5311NQI負責顯存供電。然後一些細節放下面了,感興趣可以看看。
性能測試
CPU採用英特爾酷睿i9-13900K。
主板採用華碩 ROG MAXIMUS Z790 EXTREME。
散熱採用雅浚EA5 360 白色。
內存採用十銓T-Force RGB 16Gx2 DDR5 6400。
選用的電源為鑫谷GM750 750W 冰山版,支持ATX3.0。附帶的了1根12+4Pin接口,能夠提供最高600W的供電輸出。
環境溫度23℃,本次測試主要的對比目標為RTX 3080 與RTX 3070。為了便於進行對比理解,圖文中顯卡的準確型號將會被屏蔽,僅在此處說明:
-
七彩虹 Geforce RTX 4090 戰斧
-
NVIDIA RTX 4080 Founder Edition
-
七彩虹 Geforce RTX 4070 Ti 戰斧
-
七彩虹 Geforce RTX 3090 Ti 火神 OC
-
七彩虹 Geforce RTX 3090 戰斧
-
七彩虹 Geforce RTX 3080 Ti 火神 OC
-
NVIDIA RTX 3080 Founder Edition
-
NVIDIA RTX 3070 Founder Edition
-
藍寶石 Radeon RX 7900 XTX NITRO+
-
AMD Radeon RX 6800 XT
所有測試均七彩虹 Geforce RTX 4070 Ultra W 為基準,未特殊說明均是以比例顯示,數值均越高越好。
GPU-Z 2.52版還不可以完美識別RTX 4070。RTX 4070 Ultra W的頻率最高能Boost到2850MHz左右。
理論性能測試:
AIDA64理論性能對比,RTX 4070 綜合性能稍優於RTX 3080。RTX 4070 內部的超大緩存讓內部顯存複製速度超過了1.1TB/s。浮點,整數的提升基本來自於頻率的提升。SHA-1是唯一落後的,這也是因為規格和算法的問題。
3DMARK基準測試,可以看到RTX 4070 綜合性能領先RTX 3080 4.8%。主要領先點是DirectX 光追和DX12 遊戲,其他基本是持平或者小幅落後。相比其餘顯卡,領先RTX 3070 33%,領先RX6800XT 17.8%。
3DMARK DLSS性能對比,RTX 40 系列支持DLSS 3,而RTX 30 系列不支持,因此在RTX 30 系列 DLSS 3對比中,以DLSS 2的性能做對比。AMD FSR2 最近加入3DMARK中還未完成測試,因此為0。RTX 4070 平均性能領先RTX 3080 37.2%。在沒有DLSS 3的支持下,RTX 4070 性是RTX 3080 的100%甚至99%。在DLSS 3的加持下,RTX 4070 還能摸到RTX 3080 Ti。
雖然說官方對位是RTX 3070 Ti,但是我覺得RTX 4070 打打RTX 3080 應該沒什麼問題。
VRMARK對比,Blue Room比較吃性能,7900XTX在測試過程中崩潰無結果。RTX 4070 和RTX 3080 性能接近。落後RTX 3080 Ti 7.2%,合理。
渲染對比,Blender是老牌渲染器,所以對多個設備都有支持,V-Ray則是常用於3DSMAX的渲染器,主要支持NVIDIA。Octanebench則是專門支持NVIDIA 的渲染跑分軟件。渲染一直都是新顯卡會佔優勢,畢竟有優化,所以這裡RTX 4070 領先RTX 3080 13.4%,領先RTX 3070 48.4%。
AI生成圖像對比,這裡是結果越低越好。RTX 4070 和RTX 3080 性能接近。領先RTX 3070 35.8%,合理。
遊戲性能測試(2K):
RTX 4070 的定位2K市場,但是DLSS 3的加持應該可以跑跑4K。因此我們將測試2K與4K性能進行對比。綜合對比中數值並不平均1% Low FPS。
遊戲引擎對比,選用Superposition (UE2) 、Heaven Bench、Unreal Engine 5和Unity引擎動畫對比。綜合對比上,RTX 4070 稍微領先於RTX 3080 1.8%。領先點主要是DLSS加持的遊戲,對於Heaven Bench這種老引擎,性能甚至倒退到RTX 3070級別。相比RTX 3070 有1.33倍的性能提升。
所有遊戲綜合對比,沒有標註DLSS版本的遊戲均是DLSS 2對比DLSS 3,標註版本的則是為具體版本對比。
通過分析具體數據可以發現,在不開啟DLSS的情況下,RTX 4070 在大部分遊戲中仍舊是能夠超過RTX 3080的。開啟DLSS後,RTX 4070 的性能會有明顯的領先,甚至說會優於RTX 3090 Ti。這不是新卡太強了,而是老卡跑2K真的發揮不出性能,外加DLSS 3真的好提升幀數。綜合下來RTX 4070 領RTX 3080 23.4%。領先RTX 3070 45.1%。
遊戲性能測試(4K):
遊戲引擎對比(4K)。綜合對比上,RTX 4070 相比RTX 3080 只有94%的性能。相比於RTX 3070 有1.62倍的性能。
所有遊戲綜合對比(4K),沒有標註DLSS版本的遊戲均是DLSS 2對比DLSS 3,標註版本的則是為具體版本對比。RTX 3070根本跑不動4K就不來折磨它了,用RTX 3080 Ti來代替。CS:GO有版本更新沒有參與綜合對比中,僅作參考。
通過分析具體數據可以發現,在不開啟DLSS的情況下,RTX 4070 會與RTX 3080 比較接近,開啟後,RTX 4070 會與RTX 3080 Ti比較接近。綜合性能領先RTX 3080 1.16倍,但是對比RTX 3080 Ti 只有其性能的95.7%。
DLSS 3 畫質對比
作為40系最大的賣點之一,DLSS 3的對性能提升的同時又對畫質有多少影響呢?這裡準備視頻和圖文一起進行對比。
DLSS 3 VS 原生:
DLSS OFF
DLSS 3 ON
由於人的視線首要集中在可以清晰的畫面上,而如果不清晰的畫面擁有過多細節,就會引起一種反直覺。開啟DLSS後,中遠景的過分細節被“刪減”,視覺感受會有所加強,同時近景光影也得到了進一步的改善。就能讓人有更好的視覺感受。
左DLSS OFF; 右DLSS 3 ON
我們把開關後的畫面放在一起,可以清晰的看到開啟DLSS後的畫面的線條顆粒有所減少。視覺感官上更接近與真實的圖像畫面。
不過DLSS系列的問題仍舊無法避免。由於通過裁剪光源附近的面數,開啟後的部分場景在放大後能明顯看到鋸齒。如果截圖不經意之間放大可能就會發現,此時就要好好利用NVIDIA Ansel了。
DLSS 3 VS DLSS 2:
DLSS 3對比不開啟當然非常明顯,但是對比DLSS 2呢?
DLSS 2
DLSS 3
DLSS 2與DLSS 3其實基本看不出太大的差距,如果硬要說,最多是光影之間的小部分差距。尤其是樹葉能看到更多的光影細節。
左DLSS 2; 右DLSS 3
但是如果放大對比後,DLSS 3對比DLSS 2確實能看出差別,DLSS 2的畫質感偏向於裁剪面數以及銳化,因此畫面總有一股膠狀感,而DLSS 3則很好的解決了這個問題。
DLSS 2
DLSS 3
在有光影的瓷鑽、樹木紋理表現上,DLSS 3能夠明顯的看出細節,而DLSS 2優化後的紋理就像打了一層膠一樣。非常的模糊。
左DLSS 2; 右DLSS 3
放大後這些樹木的紋理差別就非常明顯了。
總的來說,DLSS 3的優化效果還是非常明顯的,不過考慮到目前遊戲支持有限,外加DLSS 3具體的表現不知道在更低端的顯卡表現如何,我們靜靜期待其後續表現。
AV1與H.264畫質對比
AV1作為NVIDIA新一代顯卡力推的視頻編碼規格,相比主流的H.264有著體積與畫質的優勢。尤其是在未來8K視頻下,AV1將能省下不少資源。由於國內大部分在線視頻網站都是H.264,少部分支持到H.265,只有極少的實驗性AV1/VP9,這項技術主要還是服務於影視行業。當然以後你下載的高清小電影也可以受益了。
這裡主要對比AV1與H.264在使用相同的配置下編碼畫質的差距。使用OBS開啟AV1與H.264,在100000Kbps最高碼率上限下進行視頻錄製。選取微軟模擬飛行進行畫質對比,左邊為AV1,右邊為H.264。嚴格以上來說,AV1的畫質只有在強烈光影下能有強烈的差別。但考慮到在體積對比上能壓縮接近30%的空間,NVIDIA的NVENC AV1雙編碼器對於創作者或者高端遊戲視頻錄製玩家是非常友好的升級。
功耗與溫度
這次終於持平了
RTX 4070 的TGP功耗是220W,上一代的RTX 3070 也是220W。
Ultra的散熱還是不錯的。烤雞溫度不超過62.0℃,熱點溫度82.8℃,風扇轉速只有38%(1700RPM+)。此時的烤雞頻率只有~2400MHz。檢測功耗也是200W左右。
使用3DMARK進行烤機測試,RTX 4070 可以Boost到2850MHz,同時功耗只有132W左右。這是40系的經典能耗優勢了。
總結
對於RTX 4070 ,雖然性能確實不錯,不過大家最不開心的就是當前的價格,4799的MSRP明顯不能讓大家對他產生更大的興趣。尤其是當前還有很多礦卡的市場下。如果你覺得他降低了RTX 40系市場裝機的價格,那確實很對,但是大家對於它的態度,我交給評論區去討論吧。