RTX 40 SUPER 第一炮 : 4070 SUPER
NVIDIA 16 日正式發布全新中階 GeForce RTX 4070 SUPER 顯示卡,這是 RTX 40 SUPER 系列的第一炮,CUDA Core 數目相較 RTX 4070 提升 20% 但增量不加價,MSRP 售價保持在 US$599,緊接下來還會有 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 型號登場。你沒看錯將會有 Ti SUPER 出現,很多人以為 SUPER 的型號定位在 Ti 之下,實際上 NVIDIA 官方是把 SUPER 定義作半代更新,RTX 40 SUPER 是一個系列不是型號。
有人說老黃的刀法越來越離譜,或許是 AMD 與 Intel 都太弱了令 NVIDIA 無所顧忌,但數據卻是騙不了人,對比 RTX 20、RTX 30 與 RTX 40 世代的晶片規格,中高階型號的晶片規格與 Full Chip 的差異越來越大,舉例 RTX 2070 是 TU102 Full Chip 規模的 50%,RTX 3070 是 GA102 Full Chip 規模的 54.76%,沒想到 RTX 4070 竟然只有 AD102 Full Chip 規模的 31.94%,晶片規模甚至低於舊代主流卡 RTX 2060 (41.67%) 及 RTX 3060 (33.33%) 、相當可憐。
過去 NVIDIA 70 新卡都能以下犯上力克 80 舊卡甚至更高型號,但 RTX 4070 卻完全沒有這個能力,性能的提升更多來自 DLSS 3 技術的加持,主要原因是舊代庫存太多,RTX 40 規格也留手讓 AIC 有機會清貨 。根據 NVIDIA 官方數據,當啟用 DLSS 3 的 Frame Gen 後,GeForce RTX 4070 在 2K 解析度下平均較 GeForce RTX 3080 快 40%,沒有 DLSS 3 就只能和 GeForce RTX 3080 打成平手,因此 GeForce RTX 4070 在遊戲市場要取得銷售成功,很大程度視乎 NVIDIA DLSS 3 技術的普及程度,
礦難後大量二手卡湧現、舊代 RTX 30 庫存減價,加上全球經濟低迷,市場明顯對 RTX 40 中高階型號興趣缺缺,以往是 RTX 20 / 30 的中高階型號性價比吸引,旗艦級型號是追求極致性能的金主們,但 RTX 40 卻是中高階型號性價比不足,反令 RTX 4090 性價比顯得更出色,就算 US$1,599 甚至炒價也是大賣,所有玩家們並非沒錢只是找不到升級的理由。
撥亂反正的 RTX 40 SUPER
對於 NVIDIA 來說 RTX 40 SUPER 是一個大升級,但筆者認為用「撥亂反正」來形容會更貼切,NVIDIA 將會推出三款全新 RTX 40 SUPER 型號,包括 GeForce RTX 4070 SUPER、GeForce RTX 4070 TI SUPER 及 GeForce RTX 4080 SUPER,其中 RTX 4070 Ti SUPER 與 RTX 4080 SUPER 會取代舊型號,RTX 4070 Ti 及 RTX 4080 將完全停產,RTX 4080 SUPER 的 MSRP 定價會降至 US$999,當年 RTX 4080 只有 9,728 CUDA + 256-bit 16GB 敢賣 US$1,199,真是哪來的勇氣啊,玩家們都說:「畀多少少錢,買 RTX 4090 好過啦」。
GeForce RTX 4070 SUPER 是三張 SUPER 之中進步最大的一張,CUDA Core 相較 RTX 4070 增加了 20%,回到 AD102 Full Chip 規格的 38.89%,MSPR 定價 US$599 取代 RTX 4070 沿有定位,但 GeForce RTX 4070 並不會停產,而是向下調至 US$499 美元,整個佈局令 NVIDIA RTX 40 產品線回復吸引力,令人期待。
NVIDIA AD104-350 繪圖核心
與 RTX 4070 / RTX 4070 Ti 一樣,GeForce RTX 4070 SUPER 同樣採用 AD104 繪圖核心,基於 NVIDIA Ada Lovelace GPU 微架構,性能提升主要來自 FP32 運算單元數目及時脈倍增,更大的 L2 Cache 容量及全新著色器執行排序技術,升級第 3 代 RT Cores、升級第 4 代 Tensor Cores,與上代比較 Ampere GPU 微架構比較,傳統光柵圖形運算提高了 2 倍,同時在光線追蹤性能上提升近 4 倍。
採用 TSMC 4N NVIDIA Custom 制程,擁有 358 億個電晶體、 Die Size 294.5mm² 與上代 GeForce RTX 3060 的 GA106-300 Die Size 276mm² 相約,完整的 AD104 晶片內建 5 個 GPC 單元、 30 個 TPC 紋理處理群集及 60 個 SM 串流多處理器,具備 7,680 個 CUDA Cores、60 個 RT Cores 及 240 個 Tensor Cores。
▲ NVIDIA AD104-350 Block Diagram
GeForce RTX 4070 SUPER 採用 AD104-350 繪圖核心,規模相較 RTX 4070 大幅增加,回復至 5 個 GPC 單元、增至 28 個 TPC 紋理處理群集及 56 個 SM 串流多處理器,具備 7,168 個 CUDA Cores、56 個 RT Cores、224 個 Tensor Cores、224 個 Texture Unit 及 80 個 ROP。
核心時脈方面,NVIDIA GeForce RTX 4070 SUPER FE 預設時脈 1,980MHz、Boost 時脈為 2,475MHz,最高 TDP 為 220W 相較 RTX 4070 高了 20W。
▲ NVIDIA AD104 繪圖核心
記憶體方面,NVIDIA GeForce RTX 4070 與 RTX 4070 SUPER 一樣維持 192-bit 記憶體介面,搭配 21Gbps GDDR6X 記憶體顆粒,最高記憶體頻寬為 504GB/s,但 RTX 4070 SUPER 的 L2 Cache 容量由 36MB 提至 48MB,有助提升遊戲 Workload 資料命中率,降低讀取延遲達並減少 GDDR6X 記憶體頻寬使用,記憶體子系統性能將會相較 RTX 4070 有明顯改善。
NVIDIA GeForce RTX 4070 Family Full Specifications
Graphics Card | GeForce
RTX 4070
Founders Edition | GeForce
RTX 4070 SUPER
Founders Edition | GeForce
RTX 4070 Ti
Founders Edition |
GPU SKU | AD104-250 | AD104-350 | AD104-400 |
GPU Architecture | NVIDIA
Ada Lovelace | NVIDIA
Ada Lovelace | NVIDIA
Ada Lovelace |
GPCs | 4 | 5 | 5 |
TPCs | 23 | 28 | 30 |
SMs | 46 | 56 | 60 |
CUDA Cores / SM | 128 | 128 | 128 |
CUDA Cores / GPU | 5888 | 7168 | 7680 |
Tensor Cores / SM | 4 (4th Gen) | 4 (4th Gen) | 4 (4th Gen) |
Tensor Cores / GPU | 184 (4th Gen) | 224 (4th Gen) | 240 (4th Gen) |
RT Cores | 46 (3rd Gen) | 56 (3rd Gen) | 60 (3rd Gen) |
Frame Buffer Memory Size and Type | 12GB GDDR6X | 12GB GDDR6X | 12GB GDDR6X |
Memory Interface | 192-bit | 192-bit | 192-bit |
Memory Clock (Data Rate) | 21 Gbps | 21 Gbps | 21 Gbps |
Memory Bandwidth | 504 GB/sec | 504 GB/sec | 504 GB/sec |
ROPs | 64 | 80 | 80 |
L1 Data Cache/SharedMemory | 5888 KB | 7168 KB | 7680 KB |
L2 Cache | 36864 KB | 49152 KB | 49152 KB |
Video Engines | 1x NVENC (Gen 8)
1x NVDEC (Gen 5) | 1x NVENC (Gen 8)
1x NVDEC (Gen 5) | 2x NVENC (Gen 8)
1x NVDEC (Gen 5) |
TGP Power | 200W | 220W | 285W |
Transistor Count | 35.8 Billion | 35.8 Billion | 35.8 Billion |
Die Size | 294.5mm² | 294.5mm² | 294.5mm² |
Manufacturing Process | TSMC 4N | TSMC 4N | TSMC 4N |
PCIe Interface | Gen4 x16 | Gen4 x16 | Gen4 x16 |