RTX 4090 图片来源:英伟达
目前从华硕、七彩虹等合作伙伴那边看到的首批 4090 和 4080 显卡设计普遍采用全尺寸、三风扇、3-slot 厚度:
ROG Strix RTX 4090 图片来源:华硕 ROG
Vulcan RTX 4090 图片来源:七彩虹
RTX 40 系列显卡是:
- 英伟达最新推出的 Ada Lovelace 架构的第一款显卡,
- 采用了最新版 DLSS 3 深度学习超级采样技术、
- 着色器 Shader 执行重新排序 (SER) 技术、
- Ada 光流加速器、
- 第八代英伟达双AV1编码器、
- 24GB GDDR6X 显存
在游戏性能方面,40 系列最大的性能提升来自于最新版 DLSS 3 技术。
DLSS (Deep Learning Super Sampling,深度学习超级采样)能够调取低分辨率的当前帧和高分辨率的上一帧,使用卷积神经网络 (CNN) 自动编码技术来提前预测出高分辨率的当前帧。
DLSS 3 的最大突破,在于在深度学习超分辨率技术的基础上,增加了光学多帧生成能力,并且集成了英伟达开发的高速低延迟向量计算技术 Reflex。
DLSS 3 采用的 CNN 自动编码器能够接受4个输入:当前帧、上一帧、Ada 光流加速器生成的光流场数据,以及运动矢量+深度等游戏引擎数据。
最厉害的地方在于 Ada 光流加速器:它能够分析两个连续帧,捕捉导粒子、光照、反射、阴影等不包含在游戏运动矢量引擎计算当中的信息,捕捉这些像素在两帧之间移动的方向和速度,从而独立计算出一个光流场。
Ada 光流场图示 图片来源:英伟达
结果就是,从这些数据输入当中,DLSS 3 能够精确计算并重建出当前帧的四分之三,外加下一帧的全部,总体重建了总显示像素的八分之七。这样能够极大地提高了游戏帧率和图形质量,进一步降低传统渲染方式对 GPU 和 CPU 造成的负载。
DLSS 3 技术图解 图片来源:英伟达
再加上全新的 Shader 执行重新排序 (SER) 技术,和 CPU 的乱序执行一样,是计算技术领域的重大创新,能够通过动态重新调度 shader 负载,更好地利用 GPU 内的各项资源,将光追性能提高三倍,提升25%左右的帧率
英伟达也找到波兰蠢驴合作开发了一个