国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

詮釋最炫RGB顯卡!耕升GeForce RTX 4090 炫光 OC評測

業界
TIME
2022-10-28 10:10
中關村在線
分享

  從Ampere到AdaLovelace,NVIDIA耗費了兩年時間,RTX4090 給我們帶來的是幾乎兩倍于RTX3090Ti 的性能表現,第三代光追技術和第三代DLSS技術再一次告訴世界,NVIDIA仍然是這個星球上最懂圖形技術、最能夠帶來驚艷GPU芯片的半導體公司。

  我們已經為大家帶來了包括公版顯卡在內的多款RTX4090 評測,這一代的非公顯卡在設計上可以說是各顯神通,每一個AIC廠商對RTX4090 都有著不一樣的理解。今天的主角是來自耕升的GeForceRTX 4090 炫光OC,它可能是當前市場上運用了最多RGB燈光元素的RTX4090,下面我們一起來探索這塊最炫RGB顯卡。

1耕升GeForceRTX 4090 炫光OC概覽

  作為最為老牌的顯卡廠商之一,耕升的每一代產品都會在設計上給大家帶來多樣化的選擇,顧名思義,“炫光”系列就是主打外觀燈光效果的系列產品。

  耕升 RTX 4090 炫光 OC產品綜述|圖片(5)|參數|報價|點評

  耕升GeForceRTX 4090 炫光OC的正面采用了鏡面效果的鋼琴烤漆工藝設計,這種工藝在當下的電子產品上已經不太多見,它的優點是表面有著極佳的光澤效果,能夠最大程度地表達光之藝術,缺點則是容易沾染指紋。當然對于顯卡來說,沾指紋的缺點可以忽略,畢竟放到機箱里面后,很難再會把它拿出來把玩。

  在顯卡沒有點亮的時候,耕升GeForceRTX 4090 炫光OC顯得比較低調,不過一旦將它運轉起來,就能夠感受到溢出的RGB效果,整個顯卡的正面、側面都被RGB元素籠罩了起來。而且與其它顯卡在不開燈狀態下也能夠看到表面紋理的設定不同,耕升GeForceRTX 4090 炫光OC的線條設計只有在運行狀態下才能夠體驗得到,給玩家帶來“進化”的感覺。

  值得一提的是,隨機附帶的顯卡支架也能夠支持ARGB燈光效果,連同顯卡的光效都可以通過升級版GW-SOUL調控軟件進行設置,實現全局的燈光同步。

  耕升GeForceRTX 4090 炫光OC搭載了第二代“炫之黑曜石”散熱器,全新升級成由2個102mm和1個92mm風扇組合而成的強效風扇系統,配合第二代耕升“炫風之刃”造型的扇葉設計,讓加寬的9葉特殊葉型扇葉在相同的轉速下提升空氣流量,增強散熱效果,降低顯卡的溫度壓力。

  顯卡后側也采用了鏤空設計,讓冷空氣可以直接穿透顯卡的散熱鰭片,提升空氣循環速度,加快核心的熱量散發。

  第二代“炫之黑曜石”散熱器還運用了特大面積散熱鰭片,內置8根復合式熱管,并且在熱管中進行鍍鎳設計以提升抗氧能力,從而進一步提高顯卡的散熱效率。

  耕升GeForceRTX 4090 炫光OC的背面設計相對樸實了一些,一塊金屬背板覆蓋了顯卡PCB,耕升的品牌元素印刷在顯卡左側。

  顯卡頂部慣例是16pin12VHPWR 供電接口,支持全新PCI-E5.0 供電規范,出廠自帶了一組12VHPWR轉4*8Pin供電線,兼容舊型號電源無難度,最高可提供600W供電能力,為后續超頻奠定基礎。

  耕升GeForceRTX 4090 炫光OC采用三槽設計,提供了三個DP1.4和1個HDMI2.1 顯示輸出接口,至于呼聲較高的DP2.0,其實目前絕大部分消費級游戲顯示器都沒有實裝,且DP1.4a 標準也能夠支持8K60Hz刷新率的顯示器。所以,綜合來看,絕對夠用。

  總體來說,耕升GeForceRTX 4090 炫光OC的燈光效果非常吸睛,與關機狀態下的外表形成了鮮明反差,應該會受到許多RGB愛好者的青睞。

2NVIDIA Ada Lovelace架構

  本次發布的GeForceRTX 40系顯卡由全新的NVIDIA Ada Lovelace架構打造,采用TSMC4nm定制工藝(TSMC4 nm NVIDIA Custom Process),旗艦核心AD102達到了恐怖的760億個晶體管,而在RTX30系顯卡中為280億個。

  與上一代NVIDIAAmpere相比,NVIDIA Ada Lovelace在相同功率下,具有2倍以上的性能提升。最高可達到90-TFLOPS的著色器數據吞吐量,而本次發布的GeForceRTX 4090則達到83-TFLOPs,相比上一代NVIDIA Ampere則只有40-TFOPs。

  完整的AD102核心共有18432個CUDA,其中包含12個圖形處理集群(GPCs),72個紋理處理集群(TPCs),144個流式多處理器(SMs)。144個第三代光追核心(RTCores)、576個第四代張量核心(TensorCores)。另外可以看到Boost頻率也從1.9GHz猛增到了2.5GHz。

  另外一點在架構圖上沒有體現的是,AD102核心還包含288個FP64雙精度浮點核心(每SM2個),用來確保FP64代碼正確處理,包括FP64張量核心代碼。

  通常來講,單精度浮點運算會用于深度學習模型訓練,而雙精度浮點運算則用于數值模擬工作。通常游戲卡都會砍掉FP64,這既節省了成本,又對游戲本身沒有影響。而專業卡都保留有FP64,目的就是為了精度更高訓練與計算。

  此次資料中只提到了AD102核心搭載了288個FP64,尚不知道后續的推出的產品有無變更。

  了解了完整的GA102核心,我們再來看一下RTX4090的核心,其實知道了RTX4090的參數,我們大概也能了解到后續可能推出的“Ti”系列究竟相差在哪。

  相比完整的GA102來說,RTX4090共有16384個CUDA,其中包含11個GPC、64個TPC以及128個SM單元,第三代RTCores為128個,第四代TensorCores為512個。

  其實根據完整的架構圖就能看出,此次Ada架構整體結構性的改動并不大,這一點從SM單元便能清晰印證,同樣的FP32CUDA核心,同樣的FP32/INT32混合CUDA核心,同樣的L1級緩存等等。當然,每個SM單元內部的TensorCore升級為第四代。

  不過變化最為顯著的,則是第三代光追核心,我們結合兩代架構來看。在第二代光追核心中,包含負責邊界交叉測試的BoxIntersection Engine引擎,和負責三角形交叉測試的TriangleIntersection Engine引擎。

  而在第三代光追核心中,還增加了兩個新的引擎:OpacityMicro-Map Engines(OMM)和DisplacedMicro-Mesh Engines(DMM),這兩個新的硬件單元可以極大地提升光追性能(具體原理后文詳細介紹)。

  至此,每2個SM單元組成一個TPC單元,每6組TPC單元組成一個完整的GPC頂層單元(在部分核心中,會出現5組TPC組成一個GPC單元的情況)。

  而每個GPC單元又搭載一個獨立的光柵引擎、兩組ROP分區(每組包含8個ROP單元)。

  過多關于數數的部分就不再介紹了,畢竟此次架構圖的大面上與NVIDIAAmpere架構基本相同,下面我們分別來看看,除了性能Ada架構還有哪些升級。

  ShaderExecution Reordering (SER)著色器執行重排序

  SER主要的作用是提升著色器性能,它可以將效率低下的工作負載,動態重組為更高效的工作負載。主要針對光線追蹤的性能提升非常大。

  簡單地說,GPU在執行類似工作的時候效率最高。但隨著光追效果越來越強大,每個場景可能有數百萬條光線照射在不同材質上,而我們知道不同材質的反射率,以及反射效果也是不同的。所以這樣就為著色器創建了大量的、發散的,效率低下的工作負載。

  SER則可以將這些雜亂的指令重新分門別類,動態重組為更高效的工作負載。根據NVIDIA的說法,SER可將著色器性能最多提升2倍,并將游戲幀率最高提升25%。

  舉個簡單的例子,當光線第一次從發射端到碰撞端是非常有規律的射線,而碰撞到物體后的二次光追,則會出現大量發散的、無規律的反射,這對于光追負載是非常高的。而從圖中便能看到,SER可以將這些指令進行二次排序,以發揮出著色器的最大性能。

  不過好在這么實用的功能并不是RTX40系的專利,它是一個易于集成的SDK,目前需要游戲開發商集成在游戲中。另外由于它是一個通用的邏輯,后續也有可能直接集成在Windows的API中,這樣游戲開發者就無需特意引用,直接調用系統API即可。

  可以說SER對于手持RTX20系及以上(能夠開啟光線追蹤)的N卡用戶來說,是極大地福音。畢竟免費提升的光追性能,誰不喜歡呢。

  第三代RTCores

  RTCore的作用在于更快的光線追蹤計算能力,如果說在RTX30系顯卡中,想要暢享4K高幀率游戲有點吃力,那么RTX40系顯卡中,將顯得輕而易舉。

  在GeForceRTX 4090這張顯卡上,達到了191RT-TFLOPs的處理能力,而RTX30系顯卡最快處理能力為78RT-TFLOPs,足足為2.4倍。并且根據NVIDIA的官方說法,第三代RTCore的峰值RT-TFLOPs相比于前代提高了2.8倍。而這只能說明,這張4090并非AdaLovelace架構的最終形態。

  OpacityMicro-Map Engines

  在第三代RTCores中引入了兩個重要的硬件單元,首先是OpacityMicro-Map Engines,可以理解為微映射透明度引擎,它主要的作用是優化光線追蹤渲染,可大幅減輕著色器的工作負擔。

  比如樹葉之類的復雜物體,不同的光線都會影響它的表現狀態,以及樹葉之間的光線反彈,所以對于光線追蹤的計算量是巨大的。

  不過OpacityMicro-MapEngines可以將光線追蹤特性烘焙到不透明蒙版中,所以那些不規則形狀和半透明的對象,也就能夠更快更精準的渲染出來,從而極大減輕著色器的工作負擔。

  DisplacedMicro-Mesh Engines(DMM)

  DisplacedMicro-Mesh Engines可理解為微網格置換引擎,它構建光線追蹤的BVH(Boundingvolume hierarchy)的速度提高了10倍!所使用的的顯存減少了20倍!

  DMM由第三代RTcore本地處理,與前幾代相比,它只使用基本三角形渲染復雜幾何圖形,極大減少了存儲和處理需求。

  具體的工作原理從圖中一目了然,新的DMM可以將面數非常多的復雜圖形做簡化,創造出簡單的模型,但整體的光線追蹤效果不變。

  通過一些模型數據我們可以具體看到,新的DMM將模型簡化了多少。原本1100萬三角面的模型,經過簡化后,只有15萬左右的微網格,BVH的構建速度提升了8.5倍,小了6.5倍。

  而這還不是最夸張的,越復雜的模型往往優化的效果越好,在官方展示的這幾組對比示例中,最快可提升大于15倍的速度,容量簡化20倍的模型。

  第四代TensorCores

  除了光追單元的升級外,第四代張量核心的升級更加恐怖。它采用了新的FP8張量引擎,在GeForceRTX 4090這張顯卡上,吞吐量達到了1.32Tensor petaFLOPs,提高了5倍。

  注意這里的單位——petaFLOPs。以往的TFLOPs為萬億次浮點運算,而petaFLOPs則為千萬億次浮點運算。

  DLSS3

  本次推出的DLSS3也是RTX40系一大賣點,從DLSS2.3直接邁入了3.0版本,也能看出此次的升級之大。而DLSS3也被NVIDIA官方稱為神經網絡渲染新時代。

  全新的DLSS3在原有的DLSS超分辨率的基礎上,添加了光學多幀生成技術,以生成全新的幀,而不像原來只能生成像素。

  DLSS3結合了DLSS超分辨率、DLSS幀生成和NVIDIAReflex這三大技術,能夠重建八分之七的像素,極大提高性能。

  在GPU受限的游戲中,比如2K分辨率及以上的更高分辨率,DLSS2能夠將幀率提高2倍,DLSS3則能夠提升4倍。

  本次DLSS3跨越了一個大版本,從想法和原理上也再度升級,完全“猜想”1幀的技術,我們解釋起來簡單,但實施起來需要大量的推理與演算,以及絕對超前的想法。

  不過“憑空”生成的1幀,在延遲上絕對要比DLSS2高。所以此次完整的DLSS3中,捆綁了NVIDIAReflex,可以有效幫助減小延遲。

  這也不負NVIDIA給它起了個“神經網絡渲染新時代”的名號。縱觀目前市面上的XeSS、FSR技術,DLSS絕對稱得上“巨人的肩膀”。當然,連年的創新,苦的是手持上一代顯卡的玩家,想體驗DLSS3的幀生成,目前唯一的辦法就是購入一張RTX40系顯卡。

  NewOptical Flow Accelerator

  NewOptical Flow Accelerator光流加速器是在第四代TensorCores中最新引入的,這也是為何DLSS3中的幀生成為RTX40系顯卡獨享。

  光流加速器在原本DLSS2的基礎上,還可以計算兩個連續幀內的光流場,能夠捕捉游戲畫面從第1幀到第2幀的方向和速度,從中捕捉粒子、反射和光照等像素信息。并分別計算運動矢量和光流來獲得精準的陰影重建效果。

  以《賽博朋克2077》為例,在第一幀,光流加速器會捕捉到每一個像素中的粒子、反射和光照等信息。并在第二幀中查找匹配的像素區域,計算幀之間的差值。

  如果說原來DLSS2能夠“猜”出一張圖剩下的像素,那么DLSS3除了這些,還能夠“猜”出下一幀的畫面。

  另外由于DLSS3的幀生成是在GPU中處理和運行的,所以即使遇到CPU瓶頸的游戲,AI同樣能夠提升幀率。這也是為什么在此次發布會中說到,DLSS3能夠突破CPU的限制來提升幀數。

  雙AV1編碼器

  本次升級的第八代NVENC編碼器可以說是直播、視頻、后期工作者的極大福音。它首次加入了對AV1編碼的支持,最顯而易見的效果就是直播。

  相比傳統的H.264編碼,AV1編碼的效率平均提升了40%,在同碼率下AV1編碼的畫質將更好。目前大部分直播的分辨率和清晰度,均受限于平臺規定的最大比特率。以Twitch限制的8Mbps為例,可以看到在同等帶寬下,同為2K60幀的畫面,采用AV1編碼的清晰度明顯比H.264更高。

  說起直播,OBS相信大家都不陌生,在10月份即將發布的補丁中,OBS就加入了對NVENC的AV1編碼支持

  當然,直播只是我們更容易見到的AV1優勢,在視頻工作的所有環節,AV1編碼都可以帶來極大提升。

  所以,如圖所見。NVIDIA已經為廣大用戶鋪好了一條完整的生態鏈,從編碼API、軟件、平臺到播放器,將全面支持AV1編碼。

  另外再說一下NVIDIA一直強調的雙AV1編碼。顧名思義,即部分顯卡內搭載了兩個編碼器,它所帶來的效果也是顯而易見的。

  首先,根據官方宣傳的,在4KH.265的導出速度上,RTX4090是RTX3090 Ti的2.2倍;在8KH.265的導出速度上更是達到了2.5倍。這部分的提升,大家常用的剪映同樣適用,感興趣的用戶不妨親自體驗一下。

  除了導出速度,8K60幀的視頻錄制在以前簡直難以想象,而雙編碼器的好處就是可以將圖像一分為二,兩個編碼器分別處理7680x2160的圖像信息,最后拼合完整。

  關于編碼部分,可能大部分用戶的感受不深,但當有一天,你想錄屏的時候,卻發現顯卡不支持,才會發覺它的重要性……

  隨著圖像逐漸進入到超清時代,硬件編碼和渲染幾乎已經成為不可或缺的幫手。雖然論質量,硬件編碼仍不及CPU軟編,但軟編做到了極限畫質,也要承受時間的無窮長。甚至在一張8K渲染圖中,兩種編碼方式的時間差距就已經達到了幾個小時,遑論一段10秒的CG動畫。在不斷進步的硬件編碼中,質量和時間也在不斷地被挑戰和刷新。

3測試平臺簡介

  首先介紹一下測試平臺,為了保障耕升GeForceRTX 4090 炫光OC的性能發揮,我們的平臺也再次進行了全面更新。不過由于手頭上沒有旗艦處理器,采用了12代中高端產品,并且在電源上進行了著重升級,采用了華碩ROG雷神2代1600W的鈦金牌全模組電源。

  首先看一下GPU-Z的參數,耕升GeForceRTX 4090 炫光OC采用AD102核心,采用TSMC4nm 定制工藝(TSMC4 nm NVIDIA Custom Process),芯片面積608平方毫米,這里相對于RTX30 系的GA102的628平方毫米更小。

  擁有16384個CUDA,相比RTX3090 Ti 的10752多52%,Boost頻率達到了2580MHz,相比公版的2520MHz有一定的提升。

  采用24GBGDDR6XMicron顯存,位寬為384bit,顯存帶寬達到了1008.4GB/s,光柵單元和紋理單元為176和512。

4理論性能測試

  下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數實際測試結果如下:

  在針對顯卡DX11性能的3DMARKFS 套裝測試中,耕升GeForceRTX 4090 炫光OC的提升非常驚人,可以看到在分辨率越高的情況下這張顯卡提升越大,其中FS提升了65%;FSE提升了79%;FSU則暴力提升了82%。

  綜合來看,在整個FS套裝的測試中,耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升約為75%。

  3DMark FireStrike 系列測試是對顯卡DX11性能的全面檢驗,我們可以將FS系列的測試成績看做是大部分過去流行熱門游戲的基準參考,耕升GeForceRTX 4090 炫光OC相比上一代旗艦RTX3090Ti 以及RTX3090 都有著巨幅性能提升。

  而在針對DX12環境下的TimeSpy 和TimeSpy Extreme 測試中,耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升分別為:TS提升69%;TSE提升77%,綜合下來約為73%。

  3DMarkTime Spy 系列是針對DX12圖形接口標準的基準性能測試,能夠代表目前以及可預見未來游戲大作的性能表現,耕升GeForceRTX 4090 炫光OC的成績同樣驚人,在考驗更為嚴苛的TSE測試中也有著高達77%的性能提升。

  PortRoyal是3DMARK中專門針對光追性能的測試項,耕升GeForceRTX 4090 炫光OC相較GeForceRTX 3090 Ti 的提升約為82%。

  本次測試我們還引入了3DMark最新的SpeedWay性能測試模塊,SpeedWay使用光線追蹤和實時全局照明來渲染逼真的光照和反射效果。它基于新的DirectX12 旗艦版功能(如網格著色器和可變速率著色)來優化性能和視覺質量,是測試顯卡全方位綜合性能的基準測試工具。

  由于這個工具剛剛發布,所以我們暫時沒有更多進行其他產品的跑分進行對比,這里的數據供大家參考,耕升GeForceRTX 4090 炫光OC的表現優于其他Boost頻率同樣為2580MHz的競品,不過性能差異并不是非常明顯。

  綜合來看,耕升GeForceRTX 4090 炫光OC的理論性能相較GeForceRTX 3090 Ti的提升約為77%,表現非常出彩。

  耕升GeForceRTX 4090 炫光OCDLSS 3 4K

  在本次測試中,我們使用3DMARK的測試版進行了DLSS3 的相關測試。在4K分辨率下,DLSS關閉為58.43幀,DLSS3 開啟后為175.51幀,提升幅度高達200%,這樣的性能跨越著實罕見!

  RTX3090 Ti DLSS 2 4K

  另外我們也測試了GeForceRTX 3090 Ti 在該程序下成績,其中DLSS關閉為32.73幀,由于不支持DLSS3,所以在DLSS2 下的成績為83.63幀。

  耕升GeForceRTX 4090 炫光OC在開啟DLSS3 后,相比關閉提升了200%;而GeForceRTX 3090 Ti 在開啟DLSS2 后,相比關閉提升了155%。

  當然DLSS3最夸張的還不止數字上這么簡單,我們再來看看這張圖。

  耕升GeForceRTX 4090 炫光OCDLSS 3 8K

  在8K(7680x4320)分辨率下的 DLSS3 測試中,耕升GeForceRTX 4090 炫光OC在DLSS關閉的情況下僅有13.43幀,已經無法正常運行游戲,而在開啟DLSS3 后,一躍達到了93.68的流暢水準,提升了598%!

  8K 下的測試成績意味著耕升GeForceRTX 4090 炫光OC已經可以滿足8K@60fps的游戲運行及格線,如果適當降低畫質,畫面幀率甚至可以突破100Hz,這讓現在的8K電視等設備也可以用于游戲需求,為玩家帶來更加極致的游戲畫面。

5常規游戲性能測試

  由于本次RTX40 系加入了DLSS3 新技術,所以后面會進行單獨測試,這里依然選擇主流的幾款3A大作進行游戲性能對比。

  首先在《地平線5》中,可以明顯看到,不止在1080p分辨率下,即使在2K分辨率中,受限CPU的情況依然明顯。作為一款標準的3A游戲,在4K分辨率下依然可以跑到149幀,這在以前絕對是無法想象的。

  對于像《地平線5》這樣的賽車游戲來說,賽車競速只是部分玩家體驗絕美風景的一種方式,分辨率和刷新率的改善帶來的不僅僅是游戲感受的提升,更是玩家對游戲內風土人情的全新體驗。

  性能方面,耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為:1080p提升52%;2K提升56%;4K提升75%,綜合提升61%。

  在《刺客信條:英靈殿》中,耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090Ti 的提升分別為:1080p提升59%;2K提升69%;4K提升67%,綜合提升65%。在眾生平等《英靈殿》中取得如此巨額的畫面幀數改進屬實難得,耕升GeForceRTX 4090 炫光OC即便在4K分辨率下也能夠獲得120fps的幀率表現,遠遠超過了一些競品,這非常不容易。

  在《無主之地3》中,耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為:1080p提升42%;2K提升68%;4K提升68%,綜合提升59%。

  《光明記憶:無限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線追蹤技術更多,測試條件為“RTX最高/DLSS質量”。所以測試幀數相對較低,但實際游戲配置相當親民。

  性能方面,耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為:1080p提升78%;2K提升81%;4K提升73%,綜合提升77%。

  在另外一款國產游戲《邊境》的跑分軟件中,情況基本與《光明記憶:無限》相同,測試條件均在“RTX最高/DLSS質量”下進行。

  在《邊境》中,耕升GeForceRTX 4090 炫光OC相比GeForceRTX 3090 Ti 的提升分別為:1080p提升82%;2K提升90%;4K提升85%,綜合提升86%。

  《光明記憶:無限》和《邊境》兩款最早的光追測試程序,到今天也已經陪伴著NVIDIA走過了三代光追核心,見證了光線追蹤單元從懵懂到成熟的全過程。

  耕升GeForceRTX 4090 炫光OC的提升是肉眼可見的,從初代只能保證1080P下的流暢運行,到如今在4K分辨率下獲得87fps的運行幀率,能夠切實感受到NVIDIA的技術“大躍進”。

6DLSS 3性能測試

  由于本次新技術DLSS3的推出,將有35款游戲將于近期推出全新的DLSS3功能,本次我們也拿到了部分游戲的測試版。

  另外《超級人類》、《生死輪回》、《逆水寒》“拂云庭“、《微軟模擬飛行》、《瘟疫傳說:安魂曲》都將在10月陸續發布支持DLSS3 的版本。

  其中《賽博朋克2077》、《F122》、《瘟疫傳說:安魂曲》、《微軟模擬飛行》、《逆水寒》本次進行了DLSS3 的測試,另外Unity和虛幻引擎也提供了本次的測試程序。

  本次DLSS3 的測試圖表比較繁瑣,并且增加了1%Low FPS 和延遲的測試,普通的FPS好理解,那么這個1%Low FPS 是什么意思。

  首先,游戲Benchmark通常測試的FPS即為,一段時間內的游戲平均幀。而1%Low FPS 則是將一段時間內的幀數從大到小排列,取最小的1%出來,再對這1%的數求平均值。

  其實簡單來說,這兩個數值都不能代表我們在游玩時,具體哪一刻的感受,但FPS更注重整體,而1%Low FPS 則是從最差的里面求平均,更謹慎一些。

  看懂了1%LowFPS,我們再來看這張圖表,在坐標軸左側的為延遲(越低越好),坐標軸右側的均為幀數(越高越好),并且由于牽扯到正負坐標,所以兩側的值有可能會不同。

  Frameview中的測試結果為小數點后三位,為了方便觀看,這里在幀數上進行四舍五入,延遲則保留小數點后一位。由于目前測試DLSS3 的游戲均為測試版,所以難免出現BUG。

  在《微軟模擬飛行》中,在開啟和關閉DLSS2 的時候,分數幾乎無變化。這款游戲是極度吃CPU資源的游戲,如果瓶頸卡在處理器上,那么傳統的DLSS2 的確無法提供更多的幀數加成。

  而在DLSS3 中,我們能夠明顯看到幀數的大幅提升,要知道我們所有DLSS3 的測試均在4K分辨率下進行。

  不過幀生成并不是毫無弊端,這也是為什么此次測試加入了延遲。并且在開啟DLSS3 后,NVIDIAReflex 是捆綁開啟的。但相對于DLSS2 增加的這點延遲,在實際體驗中的感受并不強。

  在《賽博朋克2077》中的數據反映比較真實,可以看到在DLSS關的光線追蹤最高的情況下,即便耕升GeForceRTX 4090 炫光OC顯卡也只有38幀,并且延遲達到了50.6毫秒。

  而在開啟DLSS3 后,幀數為138,提升了263%。雖然相比DLSS2 的延遲高了11.3毫秒左右,但相比關閉DLSS來說,依然維持在較低的水平。DLSS3 直接將耕升GeForceRTX 4090 炫光OC的運行幀數從及格線拉到了電競水平,實現了質的飛躍。

  《瘟疫傳說:安魂曲》是最新發布的一款游戲,在DLSS3 和DLSS關之間的幀數提升,同樣達到了138%。在這款游戲中,DLSS3 相比DLSS2 的延遲增加了12.1ms,在我們測試過的4090顯卡中屬于比較低的水平了。

  目前《F122》的數據測試同樣有問題,在DLSS關和DLSS2 中均沒有延遲數據。

  這一組主要看幀數的提升。其中DLSS3 相比DLSS關的幀數提升了147%,相比DLSS2 的提升也達到了23%。賽車游戲的幀數提升雖然不像FPS那樣可以提升游戲勝率,但是畫面越流暢,真實感就越強,玩家的體驗也就越沉浸,DLSS3 給《F122》帶來的改善相當巨大。

  最后則是國產游戲《逆水寒》的光追測試,本次我們選擇的測試Demo采用了真正的全局光照。

  在嘗試關閉DLSS運行后,幀數僅有個位數,而延遲早已上萬。還記得在純光線追蹤軟件中測試的《光明記憶無限》和《邊境》,在本次只有DLSS2 的情況下都能夠達到80幀左右。而《逆水寒》這款真正意義上的全局光照,在DLSS2 開啟后僅有50幀左右,著實恐怖。不過在開啟DLSS3 的情況下,4K分辨率也來到了82幀,已經可以保證基本的游戲體驗了。

  畫質方面,在上圖中我們截取《賽博朋克2077》中的一角,可以看到在兩種DLSS模式下,相較原畫質幾乎沒有明顯變化,只在柵欄處的光影效果有所不同,但對于如此大幅度的幀數提升,這點瑕疵幾乎可以忽略不計。

  RTX3090 Ti即時幀數39幀

  耕升GeForceRTX 4090 炫光OC即時幀數101幀

  在Unity的測試程序中,有一組實時演算的光線追蹤+DLSS的幀數對比。耕升GeForceRTX 4090 炫光OC在開啟DLSS3 后,實時幀數為101;而GeForceRTX 3090 Ti在開啟 DLSS2 后,實時幀數為39幀,提升約為159%。

  DLSS關81幀

  DLSS2 160幀

  DLSS3 195幀

  在UE5提供的測試游戲中,方便地給出了DLSS的快捷測試,這里分為DLSS關(超分辨率關+幀生成關+Reflex關);DLSS2(超分辨率性能+幀生成關+Reflex開);DLSS3(超分辨率性能+幀生成開+Reflex開)三檔測試。

  其中,耕升GeForceRTX 4090 炫光OC在DLSS關的即時幀數為81幀,DLSS2 為160幀,DLSS3 為195幀。不過UE5這個測試的DLSS3 延遲為48.00ms,而DLSS2 為16.85ms,相對較高。

  從DLSS3 的整體測試中能看到,在開啟DLSS3之后畫面的延遲都有小幅度的提升,不過在大多數游戲中,這點延遲其實不會造成過多的負面影響,但是其提升的幀率將會實打實地帶來更為流暢的畫面,孰輕孰重不必多說。

7專業軟件測試

  作為“90”級別的顯卡,擁有24GB的超大顯存,內容創作者領域的應用是必不可少的。我們使用SPECviewperf13 這款工業、專業軟件跑分測試。

  對比顯卡為耕升 GeForceRTX 4090 炫光OC顯卡、上一代旗艦GeForceRTX 3090 Ti 顯卡以及上一代游戲旗艦GeForceRTX 3080 Ti 顯卡。

  在SPECviewperf13 的軟件測試中,每款專業軟件對于性能提升的程度不盡相同,其中SW相比RTX3090Ti 提升了34%,MAYA相比RTX3090Ti 提升了42%,CREO相比RTX3090Ti 提升了41%,CATIA相比RTX3090 Ti 提升了56%,3DSMAX 相比RTX3090Ti 提升了54%。

  耕升GeForceRTX 4090 炫光OC測試得分

  RTX3090 Ti 測試得分

  Blender是一款專業的三維渲染軟件,本次推出了固定的Benchmark跑分軟件,省去了安裝軟件下載素材的麻煩。這款跑分軟件只需下載好啟動程序,軟件會自動渲染測試monster/junkshop/classroom共三個場景。

  上圖為耕升GeForceRTX 4090 炫光OC顯卡得分,分別為6510/2977/3044分,平均4177分;下圖為GeForceRTX 3090 Ti 顯卡得分,分別為3136/1812/1549分,平均2165分。通過平均分的比較不難發現提升非常明顯,達到了93%,這對于以幀為渲染單位的動畫來說,能夠大幅度節省時間。

  在專業軟件的測試中也可以感受到耕升GeForceRTX 4090 炫光OC的優秀性能表現,雖然相對游戲幀數的提升沒有那么夸張,但是對于工作室來說,每一個流程的效率改善都能夠加快項目進度,從而快速完成任務,提升人效。

8功耗及溫度測試

  功耗測試中,我們選擇FurMark軟件進行拷機測試,并采用GPU-Z檢測溫度,功耗僅計算顯卡自身。

  在本次的烤機測試中,耕升GeForceRTX 4090 炫光OC的表現同樣出色,在100%TDP 滿載的情況下,功耗來到了450W左右,與公版相當,但對于電源的要求也非常恐怖了,官方建議電源850W,這方面的預算不能節省。

  另外在滿載拷機測試中,耕升GeForceRTX 4090 炫光OC峰值溫度為67.2℃,而熱點的峰值溫度為75.1℃,GPU頻率來到了2610MHz,已經突破了標定值2580MHz,這也是它整體性能表現相對于其他競品來說更好的原因之一。

9詮釋最炫RGB顯卡

  AdaLovelace 架構給第三代光追核心增加的兩個新引擎OpacityMicro-Map Engines(OMM)和DisplacedMicro-Mesh Engines(DMM)為RTX4090 的光追性能帶來的提升令人難以置信,同時DLSS3 更是被NVIDIA官方稱為神經網絡渲染新時代,光線追蹤+神經網絡渲染,為NVIDIA在過去幾年一直推動的圖形技術賦予了更多的想象空間。

  4K 高刷新的3A大作將不再是通過妥協畫面質量才能夠獲得的,游戲玩家們可以憧憬8K分辨率下的極致虛擬世界,游戲工作室們也能夠在新顯卡算力的支持下,進一步發揮想象空間,提升游戲畫面的真實氛圍,為游戲世界帶來更多的精彩故事。

  耕升GeForceRTX 4090 炫光OC圓滿詮釋了它“最炫RGB顯卡”的定位,通過極致的反差感為玩家帶來個性化十足的燈光方案,哪怕你不是RGB愛好者,也不得不感嘆耕升實在是太會了,把顯卡的燈光設計帶到了新的高度。

  同時,耕升GeForceRTX 4090 炫光OC也有著不俗的性能表現,無論是理論性能測試還是游戲性能實測,都有著超越同級競品的性能表現,可謂是有里有面,有顏值也有實力。綜合下來,是一款沒有明顯短板的RTX4090 顯卡,如果你想為自己的RGB機箱增添更多活力,那么耕升GeForceRTX 4090 炫光OC再合適不過了。目前這款顯卡已經正式上市銷售,感興趣的朋友不要錯過!

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  新華社蘭州10月27日電(記者王銘禹)記者從甘肅省發改委新能源處獲悉,甘肅省張掖盤道山和肅南皇城兩座抽水蓄能電站27日集中開工建設。這兩座抽水蓄能電站是《抽水蓄能...
業界
  海天味業的“水逆”仍在持續。  10月26日,海天味業(603288.SH)發布了2022年第三季度財報。前三季度海天味業營業收入190.94億元,同比增長6.11%;實現歸屬凈利潤46.67億...
證券

相關推薦

1
3