在整個(gè)RTX 40系顯卡中,GeForce RTX 4090被認(rèn)為是最值得買的型號(hào)。無(wú)論是基礎(chǔ)規(guī)格,還是實(shí)際展現(xiàn)出來的性能水準(zhǔn),GeForce RTX 4090相對(duì)家族中的其它型號(hào)而言,都實(shí)現(xiàn)了實(shí)質(zhì)性的巨大提升。對(duì)于這樣一款巔峰級(jí)產(chǎn)品,老牌顯卡廠商影馳最近推出了全新的影馳20周年GeForce RTX 4090顯卡,它是影馳20周年的傾心之作,也是這家老牌顯卡廠商與巔峰性能的珠聯(lián)璧合。因此,無(wú)論是在外觀設(shè)計(jì)、做工用料,還是在性能、散熱調(diào)校方面,這款產(chǎn)品充分展現(xiàn)了影馳深厚的產(chǎn)品設(shè)計(jì)制造功力。
接下來就讓我們通過本篇評(píng)測(cè),一起感受一下這款旗艦級(jí)新品的魅力吧。
成立于1993年的影馳,整個(gè)品牌歷史已長(zhǎng)達(dá)30年之久。而本次推出的影馳20周年GeForce RTX 4090顯卡,是為了紀(jì)念影馳品牌于2003年正式進(jìn)軍中國(guó)市場(chǎng)的扛鼎之作。這20年彈指一揮間,但影馳為中國(guó)用戶帶來的經(jīng)典產(chǎn)品不勝枚舉。“名人堂”、“金屬大師”等系列誕生的經(jīng)典產(chǎn)品,為眾多玩家?guī)砹俗吭襟w驗(yàn)。
而這一次,影馳20周年GeForce RTX 4090顯卡再次以出色的外觀設(shè)計(jì),扎實(shí)可靠的品質(zhì)做工,呈現(xiàn)在大眾用戶面前。
·純白配色高顏值高品質(zhì)旗艦卡
影馳20周年GeForce RTX 4090顯卡從PCB到卡體外部裝甲都采用了純白設(shè)計(jì),對(duì)于當(dāng)下一些追求純白配色主機(jī)的朋友可以說是最佳選擇。而且白色本身也是影馳不少經(jīng)典產(chǎn)品的標(biāo)志色,放在如此有紀(jì)念意義的一款產(chǎn)品上,可以說是一次完美的傳承。
顯卡前端采用100MM 11扇葉雙靜音風(fēng)扇設(shè)計(jì),左側(cè)風(fēng)扇中心蝕刻出了影馳logo,右側(cè)風(fēng)扇中心蝕刻出特殊的“20”字樣,彰顯20周年元素。最右側(cè)是背部風(fēng)扇對(duì)應(yīng)的散熱鰭片。
將顯卡翻過來之后,就可以看到背部的90mm 11扇葉風(fēng)扇了。影馳將“20”元素巧妙地與風(fēng)扇融合起來,構(gòu)成了極為惹眼的設(shè)計(jì)感,尤其是風(fēng)扇右上角的“th”字樣,可以說是整個(gè)設(shè)計(jì)的點(diǎn)睛之筆。
背面左側(cè),則設(shè)計(jì)了GEFORCE RTX和GALAX的品牌名稱。
顯卡上方同樣以GEFORCE RTX和GALAX 20的元素為主,另外右下角可以看到三條LED燈條,點(diǎn)亮狀態(tài)下可以呈現(xiàn)炫麗的ARGB背光效果。
此外,卡體右側(cè)邊緣也印有“20”字樣。所以總體來看,影馳20周年GeForce RTX 4090顯卡的設(shè)計(jì)充分突出了20周年的設(shè)計(jì)元素,讓這款產(chǎn)品更具紀(jì)念價(jià)值和收藏價(jià)值。
視頻輸出接口方面,這款顯卡配置了1個(gè)HDMI 2.1和3個(gè)DP 1.4a。HDMI 2.1可支持120Hz@4K HDR、60Hz@8K HDR視頻輸出。
這款產(chǎn)品的供電口設(shè)計(jì)在了顯卡底部右下角的內(nèi)側(cè),并隨機(jī)附贈(zèng)了一根延長(zhǎng)線,這種隱藏式的供電口設(shè)計(jì)使得整個(gè)顯卡更加美觀,而且在走線方面可以做的更加隱蔽,對(duì)于追求隱藏式走線的朋友來說非常合適。
在眾多顯卡品牌中,影馳產(chǎn)品的設(shè)計(jì)一直以來都備受用戶認(rèn)可,尤其是對(duì)于喜歡白色系配件的朋友來說,影馳顯卡往往是首選。這次推出的20周年GeForce RTX 4090顯卡,同樣擁有出色的顏值、優(yōu)質(zhì)的做工,而且還擁有紀(jì)念價(jià)值和收藏價(jià)值,對(duì)于硬件發(fā)燒友來說是一個(gè)非常值得考慮的選擇。
那么這款顯卡的實(shí)際性能如何呢?
·RTX 4090顯卡架構(gòu)技術(shù)回顧
在性能測(cè)試之前,我們不妨先來回顧一下RTX 4090的技術(shù)要點(diǎn)。
首先,RTX 40系顯卡由全新的NVIDIA Ada Lovelace架構(gòu)打造,采用TSMC 4N NVIDIA定制工藝,旗艦核心AD102達(dá)到了恐怖的760億個(gè)晶體管,而在RTX 30系顯卡中為280億個(gè)。
與上一代NVIDIA Ampere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可達(dá)到90-TFLOPS的著色器數(shù)據(jù)吞吐量,而本次發(fā)布的GeForce RTX 4090則達(dá)到83-TFLOPs,相比上一代NVIDIA Ampere則只有40-TFOPs。
完整的AD102核心共有18432個(gè)CUDA,其中包含12個(gè)圖形處理集群(GPCs), 72個(gè)紋理處理集群(TPCs), 144個(gè)流式多處理器(SMs)。144個(gè)第三代光追核心(RT Cores)、576個(gè)第四代張量核心(Tensor Cores)。
相比完整的GA102來說,RTX 4090共有16384個(gè)CUDA,其中包含11個(gè)GPC、64個(gè)TPC以及128個(gè)SM單元,第三代RT Cores為128個(gè),第四代Tensor Cores為512個(gè)。
另外NVIDIA官方也特別表明了L2 Cache容量以及最終的等效帶寬,這是RTX 40在架構(gòu)中變化比較大的地方。
我們以兩張圖來簡(jiǎn)單說明L2緩存的作用。
如果把GPU內(nèi)核比作網(wǎng)店店主,那么L1緩存就是在日常工作的屋子中堆放的可發(fā)貨產(chǎn)品,但由于所有工作都要在這間屋子進(jìn)行,堆放產(chǎn)品的空間有限;所以大部分產(chǎn)品就需要到L2緩存中,它就好比在工作室隔壁的倉(cāng)庫(kù),雖然需要走出去,但仍然是很近的路程。
如果這個(gè)倉(cāng)庫(kù)還是放不下,那么只能到更遠(yuǎn)的顯存中去調(diào)取產(chǎn)品。當(dāng)然如果有爆顯存的情況,那么這位“店主”可能還要打車去更遠(yuǎn)的系統(tǒng)內(nèi)存區(qū)調(diào)取數(shù)據(jù)。
這中間的路程和耗費(fèi)時(shí)間就好比GPU額外的工作量,如果絕大部分?jǐn)?shù)據(jù)只存放在L2緩存就可以拿到,那么將極大節(jié)省功耗。并且由于不再需要頻繁調(diào)取顯存中的數(shù)據(jù),所以顯存位寬適當(dāng)降低,對(duì)于運(yùn)行效率也是沒有影響的。
在真正的GPU中,內(nèi)核是所有計(jì)算發(fā)生的地方,而這就是L1數(shù)據(jù)緩存的作用所在。每個(gè)SM都有一個(gè)超低延遲的L1數(shù)據(jù)緩存,緊挨其處理內(nèi)核,使L1成為GPU尋找信息的首選。
然而,由于L1緩存需要離內(nèi)核非常近,不可能非常大。
如果在L1緩存中找不到內(nèi)核計(jì)算所需的數(shù)據(jù),GPU將在L2數(shù)據(jù)緩存中尋找。這個(gè)顯存系統(tǒng)位于GPU芯片上,并通過一個(gè)非常高速的橫梁系統(tǒng)連接到所有的GPC(圖形處理集群),每個(gè)GPC包括多個(gè)SM。如果在L2緩存中找到了信息,那么GPU就挑出這些數(shù)據(jù)并將其放入內(nèi)核。
如果在L2緩存中找不到信息(被稱為緩存缺失),那么GPU將通過顯存接口在VRAM中尋找。這在整個(gè)GPU存儲(chǔ)子系統(tǒng)中產(chǎn)生了很多額外的工作量,并降低了性能和功耗效率。
這張RTX 4090相比上一代RTX 3090 Ti而言,擁有更大的L2緩存。而增加L2緩存的大小可以提高性能,降低延遲,并提高續(xù)航時(shí)長(zhǎng),數(shù)據(jù)訪問在GPU上即可完成(否則GPU就要頻繁從顯存讀取數(shù)據(jù),過分依賴顯存帶寬)。所以,這也是為什么在RTX 40系顯卡中,位寬帶寬普遍偏小的原因。
·測(cè)試平臺(tái)配置信息
基礎(chǔ)技術(shù)特性回顧之后,來看看本次測(cè)試所使用的硬件平臺(tái)配置。為了確保其性能充分釋放,我們采用了目前的旗艦級(jí)處理器i9-14900K,同時(shí)搭配1600W電源提供充足的電力支持,另外在主板、內(nèi)存、硬盤方面也都采用了高規(guī)格配置。
通過GPU-Z檢索我們可以看到影馳20周年GeForce RTX 4090顯卡的基本規(guī)格,它采用AD102核心打造,TSMC 4N NVIDIA定制工藝,擁有16384個(gè)CUDA,相比RTX3090 Ti 的10752多52%,Boost頻率達(dá)到了2595MHz,相比公版的2520MHz有一定幅度提升。支持24GB GDDR6X顯存,位寬為384bit,顯存帶寬1008.4GB/s,光柵單元和紋理單元為176和512。
·3DMark理論性能測(cè)試
基本規(guī)格了解之后,下面我們看看這款顯卡的3DMark理論性能表現(xiàn)。
首先是3DMark Fire Strike的DX11性能測(cè)試。三檔跑分如下:
影馳20周年GeForce RTX 4090顯卡在性能調(diào)校方面還是相當(dāng)不錯(cuò)的,全面超過了公版RTX 4090的表現(xiàn)。FireStrike模式評(píng)分76528,F(xiàn)ireStrike E模式評(píng)分44078,F(xiàn)ireStrike U模式評(píng)分24814分, 相對(duì)公版RTX 4090而言,DX11整體性能都要更好一些。
3DMark Time Spy DX12測(cè)試項(xiàng),普通模式評(píng)分36365分,E模式評(píng)分19139分,相對(duì)DX11模式較小的優(yōu)勢(shì)來說,影馳20周年GeForce RTX 4090顯卡在DX12性能方面比公版要強(qiáng)很多,所以玩DX12游戲的話,會(huì)獲得更好的性能加持。
PortRoyal光追性能方面,影馳20周年GeForce RTX 4090顯卡評(píng)分達(dá)到了25657分,相對(duì)公版RTX 4090領(lǐng)先14%,強(qiáng)悍的DX12性能為最終的光追表現(xiàn)奠定了基礎(chǔ)。
Speed Way是DirectX12 Ultimate的專業(yè)測(cè)試項(xiàng),因此要求顯卡必須支持DirectX12 Ultimate特性,而且顯存要達(dá)到6GB及以上。在4K分辨率下,影馳20周年GeForce RTX 4090顯卡評(píng)分高達(dá)9858分,表現(xiàn)還是比較不錯(cuò)的。
最后一項(xiàng)理論測(cè)試,我們來看看DLSS的表現(xiàn)。4K分辨率關(guān)閉DLSS時(shí),平均幀率僅為57.98fps,但是開啟DLSS之后,可以達(dá)到175.01fps,提升幅度達(dá)到了202%,效果顯著。不過其實(shí)對(duì)于RTX 4090這個(gè)等級(jí)的顯卡來說,目前市面上的游戲里,大多數(shù)在開啟光追的情況下是無(wú)需開DLSS的,幀數(shù)足以滿足流暢游戲需求。從這個(gè)角度來說,DLSS在現(xiàn)階段還是更適合入門和中端級(jí)別的顯卡。
·常規(guī)游戲性能測(cè)試
RTX 4090作為目前顯卡中的天花板,玩游戲自然是小菜一碟。從理論測(cè)試來看,影馳20周年GeForce RTX 4090顯卡整體性能是相當(dāng)可靠的,所以玩起時(shí)下各類游戲來說,4K分辨率、最高畫質(zhì)沒有任何問題,想要獲得極致游戲體驗(yàn)就選RTX 4090。
那么接下來咱們看看常規(guī)游戲測(cè)試中,影馳20周年GeForce RTX 4090顯卡的表現(xiàn)。考慮到它的性能,我們就不在1080p分辨率下測(cè)試了,直接上2K和4K成績(jī)。
《極限競(jìng)速:地平線5》作為一款競(jìng)速類游戲,畫面制作精良,而且硬件優(yōu)化水平極佳。影馳20周年GeForce RTX 4090顯卡加上酷睿i9-14900K這樣的頂級(jí)硬件組合,4K分辨率平均幀數(shù)就已經(jīng)達(dá)到了136fps,2K直接飆升到177fps,流暢運(yùn)行沒有任何壓力。
《無(wú)主之地3》看似是漫畫渲染的畫面,但其實(shí)對(duì)硬件要求是相當(dāng)高的。不過影馳20周年GeForce RTX 4090顯卡拿下這款游戲沒啥問題,4K分辨率平均129fps,2K分辨率平均224fps,流暢運(yùn)行無(wú)壓力。
《刺客信條》系列最近幾代的引擎都一樣,所以畫質(zhì)表現(xiàn)沒有特別大的差異。我們參考了《刺客信條:英靈殿》的性能評(píng)分,4K分辨率平均116fps,2K分辨率平均144fps,這可能是因?yàn)?K分辨率GPU負(fù)載變低之后,游戲本身調(diào)用GPU不夠充足,所以幀數(shù)反倒低了一些,但是4K分辨率下的成績(jī)證明在應(yīng)對(duì)高負(fù)載任務(wù)時(shí),影馳20周年GeForce RTX 4090顯卡相當(dāng)可靠。
《光明記憶:無(wú)限》的光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具,比游戲中用到的光線追蹤技術(shù)更多,測(cè)試條件為“RTX最高/DLSS質(zhì)量”。所以測(cè)試幀數(shù)相對(duì)實(shí)際游戲是會(huì)低一些,這里只做參考就好。
實(shí)測(cè)下來,影馳20周年GeForce RTX 4090顯卡的發(fā)揮是相當(dāng)穩(wěn)定的,4K分辨率平均74fps,2K分辨率平均134fps,流暢運(yùn)行沒有任何問題。
在另外一款國(guó)產(chǎn)游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無(wú)限》相同,測(cè)試條件均在“RTX最高/DLSS質(zhì)量”下進(jìn)行。影馳20周年GeForce RTX 4090顯卡4K分辨率平均幀數(shù)88fps,2K分辨率平均幀數(shù)151fps,表現(xiàn)同樣比公版RTX 4090更加出色。
此外我們還測(cè)試了一些其它游戲,包括《永劫無(wú)間》、《古墓麗影:暗影》、《荒野大鏢客2》以及《地平線:零之曙光》,均是在最高特效下運(yùn)行的。所有游戲的4K分辨率平均幀數(shù)都在80fps以上,2K分辨率平均幀數(shù)超過100fps以上,沒有任何運(yùn)行壓力。
·全局光照+DLSS3.5測(cè)試
當(dāng)下對(duì)于顯卡而言,最大的挑戰(zhàn)就是全局光照了,開啟之后一般顯卡真的是頂不住,就連RTX 4080這種等級(jí)的產(chǎn)品,在4K分辨率下都比較捉急。只有RTX 4090這種旗艦級(jí)才能應(yīng)對(duì)如此高負(fù)載的任務(wù)。
目前《賽博朋克2077》增加了全局光照模式,并且對(duì)DLSS3.5進(jìn)行了支持。雖然相對(duì)DLSS3而言,DLSS3.5沒有在幀數(shù)提升上有大變化,但是對(duì)于光影的精準(zhǔn)計(jì)算,DLSS3.5可謂是一枝獨(dú)秀。
以往,開啟光追之后,因?yàn)楫嬅鎺瑪?shù)不高,必須要結(jié)合DLSS來提升幀數(shù),以便給玩家更加流暢的體驗(yàn)。但是DLSS開啟之后,畫面效果又會(huì)有一定程度的下降。而DLSS3.5著重解決了這個(gè)問題。
下面我們來看看《賽博朋克2077》的全局光照測(cè)試情況,以及不同DLSS等級(jí)下畫面的幀率表現(xiàn)。
4K分辨率,全局光照模式下,開啟DLSS3.5,也就是光線重構(gòu),游戲平均幀數(shù)為74.38fps,流暢游玩是沒啥問題的。
如果想要獲得更好的幀數(shù)體驗(yàn),大家還可以開啟“幀生成”,也就是DLSS Frame Generation。開啟之后,在DLSS質(zhì)量模式下,平均幀數(shù)可以達(dá)到80.84fps。
平衡模式提升到95.29fps。
性能模式提升到111.95fps。
而超級(jí)性能模式下,幀數(shù)可以達(dá)到150.1fps。
不過如果大家追求極致畫質(zhì)的同時(shí)需要流暢畫面的話,只需要開啟全局光照和DLSS3.5即可。影馳20周年GeForce RTX 4090顯卡運(yùn)行起來是沒有任何問題的。
那么DLSS3.5開啟之后的實(shí)際效果如何呢?注意看下圖。
除了與RTX OFF對(duì)比外,可以注意上方廣告牌的字體,在RTX ON/DLSS OFF中,會(huì)有模糊和顯示不全的問題,但開啟DLSS 3.5后明顯清晰了很多。
同樣的情況在反射中也相當(dāng)明顯,可以看到地上水坑中的廣告牌倒影,在未開啟DLSS 3.5時(shí)難以分辨,而開啟DLSS 3.5字體的邊緣更清晰。
下面圖片中的場(chǎng)景更加明顯,無(wú)論是上方的廣告牌還是店鋪中的霓虹燈,開啟DLSS 3.5后都更加清晰了。
因此,DLSS3.5的主要目的不是在于進(jìn)一步提升幀數(shù),而是改善DLSS開啟后的畫質(zhì)下降問題,從而讓光追效果得到更好的保留。DLSS3.5通過引入Ray Reconstruction(光線重構(gòu))這樣的AI模型,將需要人工設(shè)計(jì)的降噪器,替換為NVIDIA超算訓(xùn)練的AI網(wǎng)絡(luò),有效提升了DLSS開啟后光線追蹤的圖像質(zhì)量。
·功耗與渲染性能測(cè)試
接下來我們?cè)倏纯从榜Y20周年GeForce RTX 4090顯卡的功耗、散熱以及渲染性能的表現(xiàn)。
首先在功耗與散熱方面,在26℃室溫下,F(xiàn)urmark GPU單烤機(jī)功耗397W,溫度為72.7℃。
這款顯卡采用了20周年專屬的∞散熱系統(tǒng)設(shè)計(jì)。前方配置雙100MM形20周年專屬風(fēng)扇,背部90MM環(huán)形風(fēng)扇進(jìn)行散熱。內(nèi)部采用4×Φ8mm加4×Φ6mm熱管模組,且配有大面積液冷均熱板輔助散熱,同時(shí)顯卡的前后面板均采用鋁合金材質(zhì),堅(jiān)固耐用的同時(shí),可以有效帶動(dòng)熱量傳導(dǎo)至背板,提升散熱效率。因此在滿負(fù)載狀態(tài)下,影馳20周年GeForce RTX 4090顯卡的散熱表現(xiàn)也是相當(dāng)靠譜。
渲染性能方面,我們主要參考Blender Benchmark以及V-Ray Benchmark的測(cè)試情況,Blender和V-Ray都是行業(yè)內(nèi)知名的渲染器,下面我們看看影馳20周年GeForce RTX 4090顯卡的表現(xiàn)究竟如何?
Blender Benchmark測(cè)試標(biāo)準(zhǔn)下,三大場(chǎng)景monster、junkshop以及classroom分別得分6693、3110以及2841分,毋庸置疑是目前天花板級(jí)別的表現(xiàn)。如果想要獲得高效的渲染能力,那么選擇影馳20周年GeForce RTX 4090顯卡絕對(duì)沒錯(cuò)。
V-Ray Benchmark測(cè)試標(biāo)準(zhǔn),GPU CUDA加速性能得分3930 vpaths,GPU RTX光追性能評(píng)分高達(dá)5339 vrays,可以說是最為頂尖的渲染平臺(tái)。
·AI性能評(píng)估與實(shí)際體驗(yàn)
對(duì)于RTX 4090這個(gè)級(jí)別的顯卡來說,游戲、渲染其實(shí)是比較輕度的應(yīng)用了。真正重度的應(yīng)用還是要看AI生成和相關(guān)模型訓(xùn)練。所以評(píng)測(cè)的最后,我們看看影馳20周年GeForce RTX 4090顯卡在AI方面的表現(xiàn)究竟如何?
首先參考UL Procyon的AI性能理論測(cè)試,這里我們選擇NVIDIA TensorRT下的Float 32和Float 16浮點(diǎn)運(yùn)算,通過測(cè)試可以看到,影馳20周年GeForce RTX 4090顯卡得分分別達(dá)到了1943分和3501分,AI性能表現(xiàn)卓越。
此外我們還使用Stable Diffusion進(jìn)行了圖片生成實(shí)測(cè),它可以借助N卡的CUDA加速提升效率。這里選用了一長(zhǎng)一短兩套提示詞進(jìn)行測(cè)試,每次生成10張圖片。實(shí)測(cè)短提示詞生成10張圖片時(shí)間為9.82秒,長(zhǎng)提示詞生成10張圖片時(shí)間為15.64秒,整體效率可以說是相當(dāng)出色。
·評(píng)測(cè)總結(jié)
通過一系列的測(cè)試可以看到,影馳20周年GeForce RTX 4090顯卡自身的性能調(diào)校相比公版RTX 4090要好不少,同時(shí)通過高效的散熱系統(tǒng)設(shè)計(jì),使自身能夠在100%滿負(fù)載狀態(tài)下獲得極為優(yōu)秀的散熱表現(xiàn)、功耗釋放以及性能輸出,對(duì)于追求極致體驗(yàn)的游戲玩家、追求高效體驗(yàn)的生產(chǎn)力用戶來說,這是一款非常值得選購(gòu)的產(chǎn)品。
此外不得不說,影馳20周年GeForce RTX 4090顯卡的外觀設(shè)計(jì)很容易吸引到用戶的關(guān)注,作為一款頗具紀(jì)念意義的產(chǎn)品,它在整體設(shè)計(jì)、做工用料方面達(dá)到了頂尖水準(zhǔn)。同時(shí),隱藏式的供電口設(shè)計(jì)可以給側(cè)透機(jī)箱或海景房機(jī)箱帶來更好的走線方案,可以讓顯卡供電線纜完全隱藏起來。
總體來說,影馳20周年GeForce RTX 4090顯卡是一款性能強(qiáng)悍,設(shè)計(jì)做工出眾,且極具收藏意義的產(chǎn)品,喜歡白色系配件,亦或者對(duì)于硬件有極致追求的朋友不容錯(cuò)過!
此外,影馳還推出了內(nèi)存與固態(tài)硬盤產(chǎn)品線的20周年紀(jì)念版產(chǎn)品,包括影馳星曜20周年紀(jì)念版內(nèi)存、影馳HOF EXTREME 50s 20周年紀(jì)念版SSD、影馳星曜 20周年紀(jì)念版SSD。顏值出眾,情懷拉滿。感興趣的玩家也可以關(guān)注一下!