礦難來襲、玩家盤算何時下山之際,老黃帶著他的40 系顯卡來了!

首發三款高端型號,RTX4090 24GB、RTX4080 16GB 和 12GB 顯存兩版。
話不多說,直接上規格:

三款游戲幀數測試,在 4K 分辨率、全高設置、開啟光追與 DLSS 情況下,4090 提高到上代旗艦 3090Ti 的2-4 倍,4080 與 3080Ti 對比也提高到原來的2-3 倍。


來看一組實機畫面對比,來自《微軟模擬飛行》。

另外英偉達還與波蘭蠢驢合作,給《賽博朋克 2077》開發了 " 全極致光線追蹤模式 ",軟硬協作榨干所有性能,幀數直接 x4。

要達成這些效果,靠的是全新 GPU 在制程工藝、硬件架構、軟件算法上的一系列改進。
臺積電工藝、DLSS3 放大招
全新架構Ada Lovelace,切換到臺積電 4N 定制工藝(5nm),專為生產 GPU 優化的那種,而 Ampere 時代用的還是三星 8nm。
新工藝加持下,RTX4090 塞進了 760 億個晶體管、1.8 萬個 CUDA 核心,比上一代增加 70%。
同時與上一代架構 Ampere 對比,能效比也有較大提升。

一個重頭戲是DLSS3,這一次 AI 能力不僅用于超分辨率,還會用于插幀。
老黃說,以后你看到的游戲畫面中大部分像素都不是直接渲染出來的,而是 AI 預測的。

接下來,英偉達把新架構下的 SM 多單元流處理器、負責 AI 計算的 Tensor Core 與負責光追的 RT Core 都升級至新一代。

SM 多單元流處理器方面,最大的更新是 "Shader 執行重排列 " 技術(Shader Execution Reordering)。
老黃講到,光追吃性能的主要原因是 GPU 內部高度并行化、擅長做大量重復性高的工作。而光追場合下光線不斷反射與全場景內不同材質交互并不能發揮 GPU 優勢。
這項技術負責動態調度工作負載、合理安排計算資源,能給光追帶來 2-3 倍性能提升,光追之外的綜合游戲性能也提升 25% 左右。
這是與 CPU 亂序執行同等重要的計算革新。

張量核心 Tensor Core,用了數據中心 GPU H100 的同款,新增 FP8 精度數據格式支持,吞吐量增加 5 倍。
光線追蹤核心 RT Core方面, ray-triangle 交叉吞吐量提高兩倍以上,還新增了 Opacity Micromap 引擎專攻樹葉、粒子和柵欄這種光線通過縫隙的場景。

總的看下來,新顯卡架構主要性能提升都是圍繞光追,還有那么多不支持光追的老游戲怎么辦?
為解決這個問題,英偉達推出游戲 MOD 開發工具RTX Remix。
一邊玩游戲一邊打開它,就能直接從 GPU 渲染指令里攔截游戲的圖形資產,包括幾何建模、材質、燈光、攝像機位置等。

在 AI 輔助下給這些資產增加細節、超分辨率、增加物理性質、添加光追和 DLSS 支持都不在話下。
還能一鍵打包成 MOD 發布,讓老游戲也能煥發第二春,比如讓 20 年前的《上古卷軸 · 晨風》畫質超過最新的《上古卷軸 · 天際》。

英偉達官方為經典解謎游戲《傳送門》制作了光追 MOD,將以免費 DLC 的形式稍后發布。

全在討好玩家,除了價格
相較于 RTX30 系列,40 系列顯卡的性能增強夠有誠意了,那么價格如何呢?
直接來看黃老板給出的價格:
RTX 4090 定價 1599 美元
RTX 4080(16GB)定價 1199 美元
RTX 4080(12GB)定價 899 美元。
在國內,目前給出的售價是:
RTX 4090 12999 元起
RTX 4080(16GB)9499 元
RTX 4080(12GB)7199 元。
為了方便比較,也順便把之前國內 RTX30 系列的官方售價擺上來:
RTX 3090 11999 元
RTX 3080 5499 元
RTX 3070 3799 元
從給出的定價來看,90 系列的變化幅度并不是很大,國內售價在原來的基礎上漲了一點,算得上是 " 高性價比 "(但這價格依舊是普通網友可望不可及)。
對比之下,80 系列新出的兩款顯卡漲價就比較明顯,RTX 4080(16GB)相較于 3080 漲價近 50%,被外界認為是對標 RTX 3070 的 RTX 4080(12GB)也漲了近 50%。
網友直呼:這根本沒想讓我們買 40 啊。

(看來黃老板飽受礦難其害,不知道手里還有多少 30 系顯卡)
不過游戲發燒友們也可以再等等。
在得知英偉達要發布 40 系列顯卡后,AMD 也坐不住了,后腳就透露消息稱:11 月 3 日會發布 RX 7000 系列顯卡。
并且還放出了一張性能對比圖,稱其性價比高,能效好。

值得一提的是,雖然這次 RTX40 系列相較于 30 系列性能翻倍,但功耗方面卻沒有很大的漲幅。
RTX 4090 功耗正如之前傳言一樣為 450W 與 3090Ti 持平,RTX 4080(16GB)為 340W,RTX 4080(12GB)為 285W.
對于 RTX4090,英偉達建議使用 850W 的電源,12GB 的 RTX 4080 需要 700W 的電源,16GB 需要 750W 的電源。
不僅如此,英偉達此次還升級了散熱系統,進一步優化了雙軸流通系統,將風扇尺寸和翅片體積增加了 10% ,并升級為 23 相電源。

(這尺寸倒是越來越大了)
甚至有網友調侃稱:

除此之外,大家的 AI 導師李沐也第一時間給出了自己的看法。
4090 相比 3090Ti,AI 訓練來說重要的參數都沒增強,增強多卡并行的 NVlink 還給砍了,不如再等等 4090Ti。

這次的 40 系新卡,你沖嗎?
原文地址:http://www.myzaker.com/article/632aacd08e9f09056a3fd65b