大家好,我是黄昏百分百,很荣幸获得了英伟达与七彩虹的联合邀请,参与到RTX 4090显卡的媒体首测中来,我拿到的是七彩虹iGame GeForce RTX 4090 Neptune OC显卡,也就是我们俗称的水神显卡。
今天便与各位实际测试一下,这款全新次代的英伟达旗舰显卡,到底有着多么巨大的架构与性能进步。废话不再多说,我们开车吧。
Ada Lovelace 架构优势分析
新架构,新制程
▲而Ada架构的GPU则是由多个GPC组成的,以一个完整的AD 102芯片为例,其拥有12个GPC,72个TPC,144个SM,18432个 CUDA核心。
▲而目前的RTX 4090的GPU芯片中,则拥有128个SM,16384个CUDA核心。可见Ada架构的GPU未来还有进一步提升性能参数的空间。
▲得益于Ada架构的巨大进步,RTX 4090的算力相较于RTX 3090 Ti也有着翻倍的提升,由RTX 3090 Ti的 40 TFLOPS提升至83 TFLOPS,这是一个什么概念呢?在2003年上映的电影《终结者3》中,毁灭人类的天网超级计算机算力为60 TFLOPS,而现在大家手上的一块显卡的性能便超过了天网,让人惊叹这些年来科技进步之快,当年的科学幻想一个又一个成为现实。
▲技术方面,ADA架构的RTX显卡还带来了着色器执行重排序、微网格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。这几个技术,我会在后面详细介绍。
▲最后,在能效比方面,Ada 架构的效率也令人感到不可思议:在相同的功率下,其性能相较安培架构最高可达两倍以上;增大功率,性能还能持续提升。
第三代光线追踪 画面更加真实
这里先说一下着色器执行重排序 (SER) 技术吧。
▲高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)
着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。
▲通俗一点说,SER技术便是通过将排序,使显卡由逐个运算加法改为了运算乘法,自然效率能够得到大幅提升,同时不会增加显示延迟。
▲紧接着我们再说一下第三代RT CORE新搭载的两款引擎,除了在安培架构中已经使用的Box Intersection Engine与Triangle Intersection Engine两款引擎。Ada架构搭载的新款 RT CORE 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
▲OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒,围栏等。
▲以树叶为例,全新ADA架构RT Core搭载的OMM引擎可将树叶分为全透明部分,不透明部分与半透明部分,大幅减少着色器工作量,进而明显降低光线追踪对游戏性能的影响。
▲左侧为未开启OMM引擎时的着色器工作量,右侧为OMM引擎开启后的着色器工作量,可见OMM的性能立竿见影。
▲而面对珊瑚蟹这种极不规则,超多个平面(三角形)的物体,则需要DMM引擎来提升光追性能了。
▲相较于安培架构需要将多个三角形与复杂的BVH放入RT CORE中进行处理,ADA机构可以将图形转化为一个基础的三角形,一个Displace Map与一个简单的BVH,再放入RT CORE中进行处理。
▲因此,DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。
DLSS 3 让帧数起飞
▲有一说一,光线追踪还是会对游戏帧数有一定的负面影响的,所以就需要DLSS来提升游戏帧数了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度学习超级采样),是一种通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像的方法,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。
▲从图灵架构的RTX 20系显卡开始,DLSS技术随着显卡架构一起进化,目前已经进化到了第三代DLSS,除了代表性的DLSS 超分辨率技术,还融合了DLSS帧生成技术与NVIDIA Reflex技术。
▲这里重点说一下DLSS 3中的潜在帧生成技术,其可通过对前后帧的分析,在两帧之间插入一帧,进而是游戏帧数有着近乎翻倍的提升。肯定有朋友会问,这个插帧技术与电视常用的MEMC插帧技术相比有什么区别。
▲这里便要说,电视因为其不参与画面渲染的过程,所以只能够通过算法与预测中间帧应该显示的画面,难免在阴影方面出现不准确的情况,导致插帧后画面不自然。而英伟达显卡的DLSS 潜在帧生成技术因为是在渲染过程中在光流加速器中发生的,所以可以获得准确的运动矢量(MOTION VECTORS),所以可以准确预测出中间画面所处的状态, 自然画面阴影效果就十分准确了。同时,生成的帧不需要CPU提供数据,因此整体帧率可以超过CPU渲染的帧率限制,大幅降低了对CPU性能的要求。
▲同时,DLSS 3 潜在帧生成技术与超分辨率技术结合,渲染1080P分辨率的原始画面,再超分辨率到4K画面,同时,2个4K分辨率的帧之间再生成一帧。所以,平均两个4K帧中,只有一张1080P的帧是CPU与显卡实际渲染的,占总生成画面的八分之一,可见DLSS技术对帧数提升之大。
我们来比较一下DLSS开启后对画面效果的影响,左侧为DLSS性能模式下的4K分辨率,右侧为原生4K画质:
▲首先看一看《赛博朋克2077》BenchMark中的截图,整体画面一眼看上去基本无差异,DLSS似乎能够无比接近原生分辨率了。
▲背景中的这个栏杆,DLSS画面还要比原生4K画质更加锐利清晰。
▲不过,背景的瓷砖上,开启DLSS后还是稍微有一点糊的,不过如果不像我这样放大多倍去找茬,是根本发现不了的。
▲在同BenchMark的酒吧场景中,DLSS开启后,画面效果则要明显比未开启DLSS时更加的透彻,顶部招牌也更加的锐利清晰,个人觉得本场景下DLSS的画质要明显优于原生4K分辨率。
▲同样,在网易大作逆水寒的测试中,DLSS开启后的地砖,相较原生4K分辨率的地砖,纹理上也更加清晰,可见在有光照充足的画面中,开启DLSS后的画面甚至可能超过原生4K分辨率的画质,且其能偶带来大幅度的帧数上升,还是很值得开启的。
NVIDIA REFLEX 低延迟技术
NVIDIA REFLEX 低延迟技术主要分为NVIDIA REFLEX SDK与NVIDIA Reflex延迟分析器,其中NVIDIA Reflex延迟分析器涉及到了外设、显示器等其它硬件,本文不做涉及,近介绍一下NVIDIA REFLEX SDK。
▲在传统的图像处理流程中,如果CPU 处理帧的速度快于 GPU 渲染帧的速度(高U低显),则会在CPU到GPU之间有一个等待渲染帧的队列,进而导致渲染延迟的增加。
▲而通过将NVIDIA REFLEX SDK直接集成到游戏中,就可以使CPU的帧处理速度与GPU的渲染速度保持同步,大幅降低渲染队列,并降低CPU背压,进而使游戏能够采样键鼠等外设最新的输入。最终降低画面与输入延迟,提高游戏体验。目前,NVIDIA REFLEX技术已经被集成在了DLSS 3中。
▲目前已经有超过35款游戏与软件支持DLSS 3,包括国产游戏《黑神话:悟空》、《光明记忆》、《生死轮回》、《仙剑奇侠传 7》等。
NVIDIA RTX REMIX 让老游戏重获新生
▲有非常多的经典游戏,无论在剧情上还是游戏性上,都堪称经典,唯独游戏画面上受开发时间限制,已经跟不上现在的潮流。因此,英伟达开发了RTX REMIX软件,可以帮助MOD爱好者在AI的帮助下,对游戏画面进行光追化重构,让游戏重获新生。
▲NVIDIA RTX REMIX可以将素材资源整合给多个软件使用,进而大幅降低MOD制作难度,提高制作效
七彩虹 iGame GeForce RTX 4090 Neptune OC 外观与细节
▲七彩虹iGame GeForce RTX 4090 Neptune OC的包装巨大无比,中心处有着显卡的图片,周边则是水流漩涡的纹路,动感十足。右下角则注明了其型号为GeForce RTX 4090,左下角也标注了其搭载了24GB的超大GDDR6X显存,使其即可成为超强8K游戏显卡,亦可作为生产力工具使用。
▲iGame Neptune系列显卡从30系的黑色变为白色,iGame Neptune的标志性特征由圆环形的海洋之眼进化成为了双波浪曲线,iGame产品设计师以水流为灵感所特别设计,遵循着水流的运动节奏打造全新的视觉语言。全新的双曲线为玩家带来从左至右贯穿的RGB视觉盛宴,光效将如水流一般静谧流淌,潺潺流动,模拟水的流动方向将曾经辉煌的亚特兰蒂斯文明时代还原得淋漓尽致,为玩家献上极具艺术气息的光影盛宴。水冷排方面也由240mm水冷排升级为360mm水冷排,进而提供更强的散热性能,为硬核的游戏玩家及内容创作者保驾护航,及时消除高负载场景下所产生的核心热源。
▲全新的iGame Neptune 显卡的冷头支持旋转,是装机更加便捷,显卡的安装位子也可以变得更加灵活。
▲接口方面,七彩虹iGame GeForce RTX 4090 Neptune OC提供的依旧是三个DP 1.4a接口与一个HDMI 2.1接口,七彩虹iGame系列一脉相承的一键超频按钮依旧得到了保留。玩家轻轻点压即可进一步获得更优的使用体验。
▲显卡金属装甲正面拥有一个iGame LOGO,让正面显得不单调,内部则藏有全覆盖的大尺寸铜底,直触GPU热源,利于传递热量。因为显卡本体与风扇分离,所以显卡尺寸更小更薄,竖装也非常不错。
▲我这里用的是追风者的白色PCIe 4.0显卡延长线帮助显卡竖装,显卡顶部拥有两个灯,透过玻璃隐约能够看到iGame的英文与图形LOGO,灯光亮起来的时候会很漂亮,信仰无处不在。
▲供电方面,英伟达在RTX 3090 Ti时便正式改为了PCIe5.0标准的12+4 Pin接口,七彩虹iGame GeForce RTX 4090 Neptune OC自然采用的也是PCIe5.0标准的12+4 Pin接口,为显卡的性能释放提供了可靠的保障。
▲七彩虹iGame GeForce RTX 4090 Neptune OC的合金外甲背板更显质感,支架为GPU及PCB平均压力。
▲采用360冷排的冰海散热器拥有3个120mm静音风扇,中间的一个印有iGame图形LOGO,左右两个则印有iGame英文LOGO,也是信仰满满。
▲冷排上拥有着风扇集线器,方便玩家自由更换风扇。
七彩虹 iGame GeForce RTX 4090 Neptune OC 参数详解
正所谓水火无情人有情,在本次测评中,我将使用上代安培架构的巅峰显卡七彩虹 iGame GeForce RTX 3090 Ti Vulcan OC,也就是大名鼎鼎的火神显卡,与本代Ada架构的巅峰显卡之一,七彩虹 iGame GeForce RTX 4090 Neptune OC,也就是与火神相对的水神显卡进行对比测试,下面我将放上二者的参数对比。
▲可以看到,iGame GeForce RTX 4090 Neptune OC 相较于iGame GeForce RTX 3090 Ti Vulcan OC,除了芯片制程之外,最大的提升便是CUDA数量与核心频率,其中CUDA数量由RTX 3090 Ti的10752提升到了16384,增加了5632(52.4%)。
而频率方面的提升同样明显,基础核心频率由1560MHz提升到了2520MHz,提升了几乎1GHz,一键超频核心频率也由1920MHz提升到了2640MHz。
因此,其性能的提升可以说是十分值得期待的。
RTX 4090 是全新旗舰级8K游戏显卡
3D Mark DLSS test 游戏性能测试
▲首先我们来进行8K分辨率下的游戏测试,因为黄昏我家境贫寒,实在没有物理分辨率8K的显示设备,所以8K游戏性能方面只能够使用3D Mark DLSS test来进行测试,其测试原理为连续进行两次的3D Mark Port Royal 光线追踪 基准测试,第一次为关闭DLSS功能,第二次为开启DLSS功能,通过游戏帧数变化来测试DLSS功能对游戏性能的提升。
▲首先有一说一,在8K分辨率,DLSS关闭的情况下,无论是RTX 3090 Ti还是 iGame GeForce RTX 4090 Neptune OC,画面都只能说比PPT流畅一些,分别为8.34 FPS与13.47 FPS。
RTX 3090 Ti只支持DLSS 1与DLSS 2,在开启DLSS 2时,帧率达到了37.36 FPS,已经算比较流畅了.
而iGame GeForce RTX 4090 Neptune OC 的帧率提升则更加明显,开启DLSS 2时帧率便达到了62.6 FPS,可以跑满HDMI 2.1接口的带宽了。而开启DLSS 3之后,帧率更是达到了94.97 FPS,要知道,3D Mark Port Royal的光线追踪可以说是达到了变态级别,很多游戏开启最高光追后,帧率依旧比3D Mark Port Royal的得分高很多,Port Royal得分94.97 FPS,实际游戏中甚至有可能跑满目前最顶级电视的8K 120Hz,试想下8K、光线追踪、高帧率三者兼得,是多么爽快的游戏体验啊!
▲而在4K 分辨率下,两块显卡都表现的更好,DLSS关闭的情况下,RTX 3090 Ti的帧率为31.42 FPS,而开启DLSS 2后, RTX 3090 Ti的帧率提升到了82.28 FPS。
而iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,帧率便达到了59.72 FPS,可以跑满常见4K显示器的60Hz刷新率,而开启DLSS 2与DLSS 3之后,分辨率分别提升到了142.14 FPS与176.73 FPS。
这两个帧率意味着什么呢?意味着其可以跑满目前高端4K电竞显示器 144Hz的基础频率与160Hz的超频后频率,显卡的显示能力,终于能满足目前最强的显示器的需求了。
3D Mark Fire Strike Ultra 测试
8K分辨率测试比较难办,4K分辨率就轻松多了,我们首先通过3D Mark进行测试。
▲Fire Strike 是一项适用于高性能游戏电脑和超频系统的 DirectX 11 基准测试。即使对于最新的显卡而言,Fire Strike 测试也非常严苛,而Fire Strike Ultra是其4K版本。
▲iGame GeForce RTX 4090 Neptune OC的3D Mark Fire Strike Ultra总得分与显卡得分分别为25248,25626,相较于RTX 3090 Ti的得分14311与13966分别提升了73.4%与83.5。
3D MARK Time Spy Extreme
▲3D MARK专为DirectX 12设计的Time Spy Extreme, Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲iGame GeForce RTX 4090 Neptune OC的3D Mark Time Spy Extreme总得分与显卡得分分别为17092,20017,相较于RTX 3090 Ti的得分10784与11107分别提升了58.5%与80.2%。
通过3D Mark的测试,我们基本得知了,在4K分辨率下,iGame GeForce RTX 4090 Neptune OC的游戏性能基本上可达到RTX 3090 Ti的160%-180%,而两者同时开启DLSS后,iGame GeForce RTX 4090 Neptune OC的游戏性能更是比RTX 3090 Ti高出一倍还多。
当然,只使用3D Mark进行测试,肯定还是不够客观的,那么我便多使用几块游戏进行测试吧。
《F1 22》 BenchMark
▲我们首先拿7月1日推出的F1Ⓡ 22为例,它支持NVIDIA DLSS和光线追踪不透明反射、光线追踪透明反射、光线追踪环境光遮蔽和光线追踪阴影几项技术,目前内测版本已经支持DLSS 3并内置了Benchmark, 相信不久的将来,正式版游戏也会更新对DLSS 3的支持。
▲在测试的过程中,我们将使用NVIDIA最新推出的游戏性能监测软件FrameView来进行测试,其可以实时记录游戏中的帧率、1% Low帧率与延迟等参数,并汇总生成CSV数据库,简单来说,FrameView可以使没有内置Benchmark的游戏也能有拥有更客观准确的性能测试方法。
这里我再补充一下为什么1% Low帧率十分重要,试想一下:
在玩PUBG的时候,你通过十几分钟的搜刮,神装全部到手,但是与人对枪的时候卡了一下,直接被爆头成盒了,这种搜刮十分钟,成盒一秒钟的经历是什么感受。游戏中往往最激烈对抗时的帧数,才是决定游戏成败的核心要素,因此,1% Low时的帧率可能要比那99%不激烈对抗时的帧率还要重要!
▲当然,F1 22是拥有BenchMark的,所以我们只使用FrameView补充测量了1% Low的数据,游戏测试画面为4K分辨率,光追效果全开。
在BenchMark测试中,RTX 3090 Ti在未开启DLSS时平均帧率仅为60 FPS,且1% Low 帧率仅为45 FPS,说真的,这对F1赛车这种激烈竞技游戏来说还是不够看的。
而开启DLSS 2之后,RTX 3090 Ti的平均帧率达到了142 FPS,1% Low 帧率也达到了101 FPS,已经很流畅了。
iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,平均帧率便已经有95 FPS了,且 1% Low 帧率也有69 FPS。
仅开启DLSS 2.0时,RTX 4090的平均帧率达到了194 FPS,且 1% Low 帧率也有123 FPS。
而当iGame GeForce RTX 4090 Neptune OC开启DLSS 3专有的 Frame Generation 帧生成功能时,平均帧率达到了可怕的 236 FPS,且 1% Low 帧率也有183 FPS。
平均帧率236 FPS,1% Low帧率183 FPS是什么概念呢?简单来说,就是目前最强的4K 160Hz的电竞显示器,居然连RTX 4090的1% Low帧率都无法完全显示出来,显示器厂商们是时候加把劲,研发并推出4K 240Hz的高端电竞显示器了!
最后,iGame GeForce RTX 4090 Neptune OC 开启DLSS 3时的平均帧率与1 % Low帧率,分别是RTX 3090 Ti的166%与181%!
《赛博朋克 2077》 BenchMark
▲紧接着我们测试《赛博朋克2077》,这款大作的媒体体验版也已经支持DLSS 3了,我们一起去体验光追效果出众的夜之城魅力吧。
▲没错,又是媒体体验版,我的Steam账号里可有着不少好东西呢,最下面那款《瘟疫传说:安魂曲》(A Plague Tale: Requiem),也将于10月18日发布,支持DLSS 3,我玩了很好玩,大家也可以期待下哦,同时大家不要急,说完赛博朋克,我就说这款游戏。
▲在实际测试中,RTX 3090 Ti在未开启DLSS时平均帧率仅为44 FPS,且1% Low 帧率仅为35 FPS,延迟为52ms,而开启DLSS 2之后,平均帧率达到了60,且1% Low 帧率也上升到了47 FPS,延迟也降低到了47ms。可以算是流畅运行了。
而iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,平均帧率便已经有69 FPS了,且 1% Low 帧率也有52 FPS,延迟为33ms,算是很流畅的运行。
仅开启DLSS 2.0时,iGame GeForce RTX 4090 Neptune OC的平均帧率达到了103 FPS,且 1% Low 帧率也有73 FPS,此时延迟最低,仅为25ms。
而当iGame GeForce RTX 4090 Neptune OC开启DLSS 3专有的 Frame Generation 帧生成功能时,平均帧率达到了可怕的 188 FPS,且 1% Low 帧率也有154 FPS,此时延迟为30ms,甚至比4K原生分辨率还低一些。
可见,开启DLSS 3时,可以大幅提升游戏帧率(为原生4K分辨率时帧率的272%),且并不会增加延迟。
《瘟疫传说:安魂曲》
▲在《瘟疫传说:安魂曲》的测试中,RTX 3090 Ti在未开启DLSS时平均帧率为78 FPS,1% Low 帧率为52 FPS,延迟为55ms,而开启DLSS 2之后,平均帧率达到了103,且1% Low 帧率也上升到了79 FPS,延迟也降低到了44ms。都能够比较流畅的运行游戏。
而iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,平均帧率便已经有123 FPS了,且 1% Low 帧率也有91 FPS,延迟为30ms,算是很流畅的运行。
仅开启DLSS 2.0时,iGame GeForce RTX 4090 Neptune OC的平均帧率达到了146 FPS,且 1% Low 帧率也有123 FPS,此时延迟最低,仅为21ms。
而当RiGame GeForce RTX 4090 Neptune OC开启DLSS 3专有的 Frame Generation 帧生成功能时,平均帧率达到了可怕的 192 FPS(为原生4K分辨率时帧率的156%),且 1% Low 帧率也有167 FPS,此时延迟为40ms,比4K原生分辨率延迟高一些,不过换来了帧数的大幅提升,完全可以接受。
《古墓丽影:暗影》BenchMark
▲感谢EPIC给我们送上了古墓丽影三部曲,暗影是其最后一部,是一个测试光线追踪与DLSS性能很好的游戏,只不过目前只支持DLSS 2,所以两块显卡都使用DLSS 2进行测试,且因其有3个测试场景,过场黑屏会影响FrameView的帧率统计,所以这里改为了使用Benchmark内置的5%Low进行比较。
▲在《古墓丽影:暗影》的Benchmark测试中,RTX 3090 Ti在未开启DLSS时平均帧率为70 FPS,5% Low 帧率为58 FPS,而开启DLSS 2之后,平均帧率达到了131,且5% Low 帧率也上升到了112 FPS,都能够比较流畅的运行游戏。
而iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,平均帧率便已经有122 FPS了,且 5% Low 帧率也有102 FPS,延迟为30ms,算是很流畅的运行。
仅开启DLSS 2.0时,iGame GeForce RTX 4090 Neptune OC的平均帧率达到了213 FPS,且 5% Low 帧率也有195FPS,已经超越了目前显示器的极限。
《地铁:离去 加强版》 Benchmark
▲《地铁:离去》是全球首款支持RTX光线追踪的游戏,由4A Games开发,因为其自带功能选项非常齐全的BenchMark,成为了众多装机爱好者们必备的跑分神器。其更新后的加强版支持全新光线追踪技术与DLSS 2.0,是一个很不错的跑分游戏。
▲因为其BenchMark本身统计的便是99%平均(去掉最低与最高)的帧率,所以直接用官方数据了。在其Benchmark测试中,RTX 3090 Ti在未开启DLSS时平均帧率为41.29 FPS,能够体验剧情,而开启DLSS 2之后,平均帧率达到了79.78,算是都能够比较流畅的运行游戏。
而iGame GeForce RTX 4090 Neptune OC在未开启DLSS时,平均帧率便已经有56.82 FPS了,可以跑满4K 60Hz的显示器。
而开启DLSS 2.0时,iGame GeForce RTX 4090 Neptune OC的平均帧率达到了125.16 FPS,值得为其配备4K 144Hz的显示器了。
《逆水寒》
▲国内网游大厂网易一直与英伟达保持着深度合作,在其游戏开发过程中大量使用诸如RTX、DLSS等英伟达的先进画面技术,而逆水寒新发布“拂云庭”场景便是全程围绕“微光渲染”设计制作,同时支持RTX与DLSS 3,我玩的是媒体测试服,正式服将于10月13日正式更新,敬请期待。
▲在实际测试中,RTX 3090 Ti开启DLSS 2之后勉强能玩,为20 FPS,而iGame GeForce RTX 4090 Neptune OC在不开启DLSS时便有18 FPS,开启DLSS 3之后更是达到了82 FPS,可以说是很流畅了。
▲这里允许我多嘴一句,开发游戏技术最前沿的光追游戏,难免有网易在炫技的成分,不过能够做到让英伟达将这款游戏选入官方测评指南,并将菜单翻译成英文,让全球媒体与玩家都能够体验到支持光线追踪网游大作,我只想说网易干得漂亮,这样的游戏越多越好。
RTX 4090是强大的生产力工具
自从英伟达在安培架构中新增了RTX 3090与RTX 3090 Ti这两款24GB显存的显卡,可以说将图灵架构时代单独命名的TITAN RTX这个生产力工具级别的显卡正式并入了GeForce RTX系列。
这里我们比较一下TITAN RTX、RTX 3090 Ti、RTX 4090这三张生产力显卡的参数:
TITAN RTX便已经搭载了24GB的GDDR6显存,RTX 3090 (Ti)更是将其升级到了带宽更高,速度更快的GDDR6X,而在最新的RTX 4090,得益于GPU制程的提升,显卡的核心频率得到了极大的提升,进而,理论上,生产力软件的运行速度也得到了巨幅的提升。
因为黄昏我并没有TITAN RTX,所以本次将只实测安培架构的巅峰之作RTX 3090 Ti与目前的最强显卡,ADA架构的iGame GeForce RTX 4090 Neptune OC,让我们看一看,全新的ADA架构显卡,生产力性能到底有多大的进化!
V-Ray 5 Benchmark 测试
▲首先我们使用V-Ray 5 Benchmark进行测试,这款软件内置了3个测评项目,分别为用于测试CPU的V-Ray测试,可以同时测试CPU与GPU的V-Ray GPU CUDA,以及考验显卡RTX渲染功能的V-Ray GPU RTX测试。本次测试中我们只测试V-Ray GPU CUDA测试的单GPU模式与V-Ray GPU RTX测试。
▲RTX 3090 Ti的V-Ray GPU CUDA得分为1793分,而iGame GeForce RTX 4090 Neptune OC的得分为4133分,是RTX 3090 Ti得分的230.5%!
▲RTX 3090 Ti的V-Ray GPU RTX得分为2337分,而iGame GeForce RTX 4090 Neptune OC的得分为5542分,是RTX 3090 Ti得分的237.1%!
OctaneBench benchmark 测试
▲OctaneBench是目前最流行的GPU渲染基准测试之一,其内置了一系列渲染测试。
▲RTX 3090 Ti的OctaneBench得分为528.22分。
▲iGame GeForce RTX 4090 Neptune OC的OctaneBench得分为1259.97分,是iGame GeForce RTX 4090 Neptune OC得分的238.5%!
Blender Open Data benchmark 测试
▲Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的测试中,我便使用了junk shop进行了光追渲染测试。
而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试。
▲RTX 3090 Ti的测试中,monster、junkshop、classroom三个场景得分分别为2628,1358,1105分。
▲iGame GeForce RTX 4090 Neptune OC monster、junkshop、classroom三个场景的得分分别为6492,2736,2672分。分别是RTX 3090 Ti得分的247%、201%、242%。
从以上3个Benchmark的比较中可以得出,iGame GeForce RTX 4090 Neptune OC的渲染能力基本上是RTX 3090 Ti的240%左右,这可以说是一个质的飞跃,如果你目前正在使用RTX 3090 Ti或RTX 3090及更旧的显卡进行大量的渲染工作,那么我强烈建议你升级到iGame GeForce RTX 4090 Neptune OC显卡,它能够大幅降低你的时间成本与人力成本。
24GB 大容量GDDR6X显存为生产力工作保驾护航
▲在之前RTX 3090 Ti首测的时候,我便比较了七彩虹iGame GeForce RTX 3090 Ti Vulcan OC与iGame GeForce RTX 3080 OC 10G在生产力方面的性能差异。
▲在测试过程中,10GBDDR6X显存的iGame GeForce RTX 3080 OC 10G经常会出现爆显存的情况而导致的无法胜任渲染工作。
▲虽然有些像Octane Render这类的软件可以借用系统RAM继续渲染工作,但是内存的传输速度要明显低于显存的,会大幅影响渲染效率。
而在当时的测试中,RTX 3090 Ti则顺利的完成了渲染工作,而iGame GeForce RTX 4090 Neptune OC同样为24GB显存,且上面已经测试了其渲染能力要比RTX 3090 Ti强很多,这里就不再进行重复测试了。
因此,条件允许的话,个人还是不建议使用RTX 3080这类10GB-12GB显存进行生产力工作,至少要上RTX 3090及以上的显卡才能够保证生产效率与稳定性。
NVIDIA OMNIVERSE MACHINIMA 简介
▲NVIDIA OMNIVERSE MACHINIMA可以从游戏,素材库等资源库导入视频素材,并通过RTX渲染器进行渲染,叠加以语音自动生成面部表情技术,物理引擎计算,AI动作采集等,将素材整合成整体的画面。
▲不同类型的内容创作者,都可以使用NVIDIA OMNIVERSE MACHINIMA进行实时的RTX内容创作与协作。
▲借由实时动态光线追踪技术所渲染的图片,已经达到了乱真的程度。
▲同时,针对人物的面部动作,还可以通过导入音频进行面部细节动作的自动渲染,这样,生成视频中的人物就不会“木偶感”十足了,同时还剩下的大量的面部东西捕捉工作,让人们能够更加专注在内容本身的创作上。
▲动作捕捉,这点不用多解释了吧,很多电影和游戏,之前都是由专业人士穿着补满传感器的衣服执行那个动作,然后再进行建模,设备成本很高,而通过AI姿势估计功能,则只需要一个摄像头,成本降低明显,且修改动作也变得更加容易了。
将以上这些功能整合起来,视频爱好者就可以相对轻松的创作出属于自己的“史诗般宏伟”的视频作品了。而对于直播主等,NVIDIA BROADCAST则可以帮助他们更加轻松的进行直播。
NVIDIA BROADCAST 简介
▲NVIDIA BROADCAST通过智能降噪,虚拟背景,摄像头自动成像功能,将直播主的人像视频源直接合成到主要视频源上,达到炫酷的效果。
▲音频采集时自动降噪,AI自动采集直播主的人像部分,完全无需绿布,就可以扣去背景,再将其无缝融入到直播的视频中去。
嗯,简单总结下NVIDIA BROADCAST,它可以帮助直播主开电脑就开始工作而无需绿布背景,更省时间,更省空间。
总结
RTX 4090既是生产力工具,又是最高端的游戏显卡。不仅能够胜任8K RAW视频加特效、3D渲染等工作,还能够非常流畅的在8K分辨率下游玩光追3A大作,不愧为NVIDIA RTX 40系列的首发护航之作了。
关于购买建议,如果你预算有限,而且只是为了在4K或2K分辨率下玩游戏,那么你可以再等等未来的RTX 4080系列,而如果你打算拿显卡在8K分辨率或4K分辨率高刷新率下玩光追大作,那么RTX 4090还是很有必要入手的。而如果你用显卡作为干饭的工具,那么即使你有RTX 3090 (Ti)显卡,个人都觉得值得升级。
如果你手头已经有RTX 3090,那么无论当作生产力工具还是玩游戏,都可以再等等。而如果
本次评测所使用的七彩虹iGame GeForce RTX 4090 Neptune OC显卡,在做工和用料上可以说是整个市面上RTX 4090显卡的金字塔尖了。七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精,比如我测试的这款七彩虹iGame GeForce RTX 4090 Neptune OC显卡相较于上代安培架构iGame Neptune显卡有着明显的设计与做工的提升,三风扇的白水神实在是太美了,散热能力也大幅增强,无一不是为了提高玩家体验而设计,在这一点上,我十分欣赏,必须要给七彩虹点一个大大的赞。目前显卡价格已经回归原价,且RTX 40系显卡无需担心矿卡困扰,刚需的朋友们可以入手了。
本次测试平台
CPU intel 酷睿i9-12900K
▲12代酷睿首发时我便拿到了i9-12900K,虽然现在13代酷睿已经发布并预售,不过因为其性能测试尚未解禁,所以我继续使用12代酷睿来进行测试。
▲Intel 在12代酷睿上首次使用了大小核心设计,i9-12900K/KF共有16个核心,其中分为8个性能核(P核)+与能效核(E核),其中性能核支持多线程技术,主要用于对核心性能要求高的游戏与生产力需求,而能效核不支持超线程技术,用于多任务处理。因此i9-12900K为一款16核24线程的处理器。
主板 七彩虹 iGame Z690D5 Ultra V20
▲iGame是七彩虹的旗舰系列产品,在主板方面iGame系列则可细分为VULCAN(顶配)与ULTRA(次顶配),本次测评所使用的是iGame Z690D5 ULTRA V20价格不高,且支持最新的13代酷睿,是十分不错的白色主题装机主板。
内存 宏碁掠夺者 Vesta Ⅱ DDR5 6000MHz CL30
▲测试内存采用的是宏碁掠夺者 Vesta Ⅱ DDR5内存,其XMP频率与时序为6000MHz CL30,不出意外是目前市面上时序最低的DDR5内存之一。
▲其在XMP频率与时序下的读取速度为94561 MB/s,写入速度为84182 MB/s,复制速度为84995 MB/s,更重要的是,其延迟仅为62.8 ns!已经远超DDR4内存所能达到的极限了。
▲而在是ROG STRIX Z690-I 主板上,其可以超频至6667MHz CL32或6800MHz CL40,其在6667MHz CL32时性能最强,内存的读取速度、写入速度、复制速度均有明显提升,读取速度、写入速度与复制速度都摸到6位数了!而随着电压的增强,内存的延时也有小幅下降。
#一键同步Steam截图#
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!