在2023年1月,NVIDIA解禁了RTX4070Ti顯卡的性能表現。CUDA核心數量不到RTX4090的一半,并且還采用的是192bit位寬的顯存,這兩點都是玩家們熱議的焦點。
此次評測,選用的RTX4070Ti顯卡為映眾RTX4070Ti冰龍超級版。
RTX4070Ti的性能到底如何?映眾RTX4070Ti冰龍超級版又能夠帶來怎樣的性能體驗?精彩即將開啟,大家往下看便是了!
全新的Ada Lovelace架構與RTX4070Ti
RTX40系列顯卡基于英偉達新一代的Ada Lovelace架構設計。為了讓大家更好地了解到這一顯卡的升級,筆者首先會對Ada Lovelace架構以及所支持的一些重要技術進行介紹。
(一) Ada Lovelace架構核心
(Ada Lovelace架構核心)
(完整規格的AD102顯示核心,具備144組SM單元)
(Ada Lovelace架構核心GPC單元)
Ada Lovelace架構核心配備了全新的第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)。根據NVIDIA官方的介紹,Ada Lovelace架構核心所采用的第3代RT Core不僅將光線與三角形求交性能提高了一倍,還將RT-TFLOP峰值性能提高了一倍之多。第3代RT Core還配備了全新的Opacity Micromap (OMM)引擎和Displaced Micro-Mesh (DMM)引擎,進一步提升了光追計算的性能以及減少計算開銷,帶來了更好的光線追蹤效果表現。Ada Lovelace架構核心配備的第四代Tensor Core引入了來自級H100數據中心GPU的FP8 Transformer引擎帶來了更加強悍的AI算力。
(第三代RT Core結構示意圖,相比前代,增加了2個功能)
Ada Lovelace架構核心在SM單元上引入了Shader Execution Reordering(SER著色器執行重排序)技術來更好的對于著色器的工作進行調度排序,在使用上可以根據不同的負載需求來執行渲染,可對負載較為統一的畫面進行渲染,降低工作開銷。根據英偉達官方的介紹,這一個SER功能將作為API開放給使用。英偉達官方宣稱,SER功能的加入至高可帶來兩倍RT Core性能上的改善,對于光追游戲來說更可帶來體驗的升級。根據NVIDIA官方的數據,全新的SM(流式單元處理器)可帶來至高兩倍的性能以及能效升級,這一項升級不可謂不小。
(Ada Lovelace架構核心SM結構圖)
Ada Lovelace架構核心除了第三代RT Core(光線追蹤核心)、第四代Tensor Core(張量核心)以及SM(流式多處理器)的升級以外,帶來了全新的第八代NVENC雙硬件編碼器,這一全新的第八代NVENC雙硬件編碼器整合了對AV1視頻編碼格式的支持,可以在傳統的H.264等格式之外,加入了對AV1這一主流新標準的支持,可以進行對于AV1格式的編碼與解碼,有效提升了生產力方面的表現,對于創作型用戶、游戲主播等群體來說更是如虎添翼。來自NVIDIA官方的數據顯示,第八代NVENC雙硬件編碼器在AV1的效率上比H.264編碼器的效率提高了40%,這一提升非常明顯。
而除了核心上的升級以外,Ada Lovelace架構核心還大幅度提升了其L2緩存,完成版的Ada Lovelace架構核心(AD102)擁有96MB的L2緩存,大容量的L2緩存帶來了數據命中率的有效提升。在現階段顯存帶寬提升有效的情況下,通過升級更大容量的L2緩存,可以進一步提升數據命中表現,帶來性能方面的升級,根據NVIDIA官方的說法,大容量L2緩存的加入為GPU的一系列操作到帶來了更高的收益,尤其是在光線追蹤等場景下,表現更為明顯。
(二) DLSS 3與NVIDIA Reflex
Ada Lovelace架構的一系列升級還帶來了全新的DLSS 3技術的獨占以及NVIDIA Reflex方面的體驗提升。
DLSS 3包含有DLSS 2(DLSS超分辨率技術),以及全新加入的DLSS幀生成技術,這一項DLSS幀生成技術依托于Ada Lovelace架構的獨立光流處理器以及Tensor Core的AI算力。在一項技術在運行過程中,其通過光流處理器所得到的一系列數據后,以光流加速技術(Optical Flow Acceleration,簡稱為OFA)來生成畫面信息,而AI算力則負責來對畫面進行進一步的優化,從而在游戲中加入了更多的幀畫面,進行幀數的提升。
DLSS 3可直接生成游戲第1幀3/4的像素以及整個游戲第2幀,相當于使用1/8的算力,就完成了整個計算過程,而通過這一個流程的循環,可在提升幀數的同時節省資源開銷,進一步帶來更好游戲體驗。
而在DLSS 3的幀生成技術上,由于可能帶來延遲的增加,因此DLSS 3在使用上也將通過整合NVIDIA Reflex這一技術來降低渲染以及操作的延遲。而根據NVIDIA官方的說法,DLSS 3通過整合NVIDIA Reflex以及一系列的技術,可以使得游戲體驗擁有媲美甚至是超越原生級的渲染、操作體驗。
(三) 40系顯卡第三彈——RTX4070Ti
(RTX4070Ti顯示核心架構圖,具備60組SM單元)
RTX4070Ti采用的是AD104-400顯示核心,擁有7680個CUDA核心。此外,RTX4070Ti還搭配12GB容量、192bit位寬的GDDR6X顯存。
映眾RTX4070Ti冰龍超級版的Boost默認設置為2670MHz,相比RTX4070Ti創始人版的2610MHz高出了60MHz。
映眾RTX4070Ti冰龍超級版顯卡欣賞
映眾RTX4070Ti冰龍超級版延續了冰龍系列的酷黑外觀設計。三風扇散熱設計,三插槽厚度。
顯卡背面設計了金屬背板,其上面有一些鏤空設計,以便兼顧散熱效果。
輸出接口為三個DP 1.4a以及一個HDMI 2.1。
散熱器頂部上面印有“GEFORCE RTX”的字樣。
顯卡供電接口為12VHPWR接口。玩家在裝機時一定要接上這部分的供電線纜。
將散熱器拆卸下來,露出顯卡PCB,我們來接著瞧一瞧它的用料。
這款顯卡雖然長度接近33.5cm,但是它的PCB并不長。通過對比明顯能夠看出散熱器和背板比PCB長出很多。
畢竟是顯卡,映眾RTX4070Ti冰龍超級版的供電設計依舊不錯。GPU左右周圍共設計了13相供電,搭配電容鐵素體電感、固態電容、Dr.MOS等高品質元器件,用料值得信賴。
全新的AD104-400顯示核心,芯片面積為294.5平方毫米,看上去尺寸比較小。
顯存是來自美光的GDDR6X,單顆2GB容量。這款顯卡PCB正面共設計有6顆顯存,組建了12GB顯存容量。
再來瞧瞧它的冰龍散熱器。這款第八代冰龍散熱系統采用三枚直徑約10cm的大尺寸散熱風扇。同時,這款散熱器支持智能風扇停轉功能,在待機狀態下或者輕負載狀態下,它的這3枚風扇會全部停轉,以便實現安靜的運行效果。
還有,中間風扇與兩側風扇設計方向相反,這樣能夠減少冷卻陣列內部的氣流紊流,從而進一步提高顯卡的整體散熱性能。
這款散熱器的金屬主體也是相當的龐大,不僅能夠為GPU進行散熱,而還能夠為顯存、電感以及MOS管進行散熱。
8根純銅復合熱管以及大面積純銅底座一體式散熱,其中7根熱管為核心散熱,另外還有一根熱管則用于連接供電部位的鰭片,搭配高達6cm的超大散熱鰭片矩陣,可以快速發散熱量。
這款顯卡的散熱器上面還采用大面積IML模內印刷RGB燈箱設計,令這款顯卡運行時炫酷有型。
RGB燈效可以利用映眾研發的INNO3D TuneIT軟件進行調節。
包裝盒附件里面還帶有一根顯卡支架。
測試平臺介紹
筆者組建了一套性能出色的13代酷睿i5測試平臺,用來測試顯卡的性能。為了對比映眾RTX4070Ti冰龍超級版的性能,筆者此次測試還加入RTX4080以及上一代卡皇RTX3090Ti的成績。
此次測試所選用的這款RTX4080是一款非公版顯卡,其GPU頻率為2205MHz,Boost頻率為2565MHz,顯存頻率為1400MHz(等效22400MHz)。
此次測試所選用的這款RTX3090Ti是一款非公版顯卡,其GPU頻率為1560MHz,Boost頻率為1890MHz,顯存頻率為1313MHz(等效21008MHz)。
英特爾13代酷睿處理器搭配RTX40系列獨立顯卡是支持Resizable BAR技術的。為了充分發揮映眾RTX4070Ti冰龍超級版顯卡的性能表現,以下測試環節均是在Resizable BAR開啟狀態下進行的。
DLSS 3是RTX40系列顯卡帶來的全新技術,在維持高畫質的情況下也可以實現更為流暢的游戲表現,這也讓玩家可以更好的享受4K光追游戲帶來的出色畫質體驗。為了更好的感受RTX40系列顯卡在游戲方面的升級,我們在測試RTX40系列顯卡時特意選擇了愛攻&保時捷(Porsche Design)聯合設計的PD32M顯示器。
這款顯示器為31.5英寸,采用MIni LED背光技術,擁有1152個獨立分區,擁有1600尼特峰值亮度,8000萬:1動態對比度,并通過HDR1400認證,在畫質上有著更為出色的表現。此外,PD32M擁有4K分辨率以及144Hz的刷新率,支持97%DCI-P3色域以及99% Adobe RGB覆蓋,并且擁有HDMI 2.1接口,是一款旗艦級電競顯示器。
俗話說好馬配好鞍,此次測試平臺的主板部分,筆者選用的是華碩ROG MAXIMUS Z790 HERO。華碩ROG新一代Z790主板采用了整合的供電設計,以及散熱及解決方案,同時還擁有全新的AEMP 2.0、AI智能優化和EZ DIY貼心設計,帶來更強的性能、更智能的優化和更好的裝機體驗。
游戲性能測試
(一) 3DMark基準測試
讓我們先來瞧瞧映眾RTX4070Ti冰龍超級版在3DMark基準測試當中的表現。性能到底有多強,大家一看便知。
在3DMark測試項目中,這款RTX4070Ti與上一代卡皇RTX3090Ti互有勝負。
(二) DLSS 3基準測試
3DMark基準測試新增加了DLSS功能測試(DLSS 3)。
根據實測來看,在開啟DLSS 3之后,RTX40系列顯卡實現了巨大的FPS提升。
(三) DLSS 3游戲實測
目前已有《賽博朋克2077》、《逆水寒》、《瘟疫傳說:安魂曲》、《光明記憶:無線》、《生死輪回》等熱門游戲大作支持DLSS 3技術。此次DLSS 3游戲實測,筆者將利用《賽博朋克2077》、《瘟疫傳說:安魂曲》等4款游戲進行測試。注意,《賽博朋克2077》的DLSS 3版本目前均處于測試階段,進行測試的話需要下載NVIDIA提供的測試版游戲。
DLSS 3游戲測試版——《賽博朋克2077》
DLSS 3游戲——《瘟疫傳說:安魂曲》
DLSS 3游戲——《巫師3:狂獵》
DLSS 3游戲——《傳送門:光追版》
通過上述4款DLSS 3游戲來看,DLSS 3技術為RTX40系列顯卡帶來的游戲幀數提升是巨大的。
(四) 其它游戲實測
接下來,筆者再測試一些非DLSS 3游戲。
游戲實測——《地鐵:離去》
游戲實測——《刺客信條:奧德賽》
游戲實測——《戰爭機器5》
游戲實測——《幽靈行動:荒野》
游戲實測——《古墓麗影:暗影》
游戲實測——《無主之地3》
非DLSS游戲中,款RTX4070Ti與上一代卡皇RTX3090Ti依舊互有勝負。
生產力性能測試
(一) AV1硬件加速編解碼測試
為什么AV1編解碼技術越來越受歡迎?理由很簡單,采用AV1編解碼的視頻能夠以更低的碼率,實現其它主流編解碼視頻相同的畫質。說白了,在視頻畫質相同的情況下,采用AV1編解碼的視頻文件體積會更小,以至于能夠為視頻創作者們節省大量的硬盤空間。
目前萬興喵影、達芬奇等視頻軟件已可支持AV1硬件加速編/解碼功能。接下來筆者利用達芬奇這款軟件,將一部12GB容量的4K視頻,利用N卡AV1硬件加速編解碼導出一部MP4視頻。
終,RTX4070Ti和RTX4080的加速效果都是相當快的。
(二) H.265硬件加速編解碼測試
繼續利用達芬奇這款軟件,將一部12GB容量的4K視頻,利用H.265編解碼導出一部MP4視頻。此項測試對比了RTX3090Ti的成績。
相比上代卡皇RTX3090Ti,RTX4070Ti和RTX4080的加速效果都是要更快的。
散熱器測試
(注:筆者所處的室溫維持在26℃)
利用FurMark,筆者將對映眾RTX4070Ti冰龍超級版顯卡進行壓力測試。
通過10分鐘的烤機,默認頻率下滿載時GPU溫度穩定在約64℃,GPU頻率穩定在約2820MHz。這款冰龍散熱器的散熱性能確實很棒,靜音效果也很不錯,令筆者很滿意。
全文總結
別看RTX4070Ti的CUDA核心數量還不到RTX4090的一半,別看RTX4070Ti僅采用了192bit位寬的顯存,但是論性能,這款新顯卡還是挺不錯的。特別是在DLSS 3技術的加持下,RTX4070Ti整體上是要超越上一代卡皇RTX3090Ti的。