GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

如果查阅Steam硬件排行版,会发现NVIDIA的60系列GPU几乎屠榜显卡排行的TOP 10,与旗舰级GPU相同的技术与功能,再加上不错的性价比,成为主流机型的合理选择。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

完整的AD106拥有3个GPC,有点类似于CPU中的3个独立核心,每个GPC同样包含了6组TPC,每组TPC包含2个流式多处理器(Streaming Multiprocessors,SM)。其中SM是可以看成诸多核心的集合体,从Maxwell架构开始引入了处理块(Sub-Core)概念。每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。

此外,每个SM下的128个CUDA Core随处理块分成4组,每组CUDA由16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core组成。

多样的组合让AD106完整形态下拥有4608个Core Core、144个纹理单元,48个ROPs和36个SM,对应的,也拥有144个第四代Tensor Core和36个第三代RT Core。每个SM包含128KB L1缓存,总共拥有32MB L2缓存。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

AD106

不过要注意的是,GeForce RTX 4060 Ti 8GB Founders Edition并非使用的是完整的AD106,它所用的版本为AD106-350-A1,GPC结构上没有做删减,同样使用了3个GPC,不过有一组GPC中屏蔽了1个TPC,即使少了2个SM。因此GeForce RTX 4060 Ti 8G FE拥有17个TPC,34个SM,4352个CUDA Core,从而着色器Shaders性能达到22 TFLOPs。

与此同时,GeForce RTX 4060 Ti 8GB FE还拥有136个第四代Tensor Core,Tensor FP8/INT8的稀疏度性能(Sparsity)达到353 TFLOPs,以及34个第三代RT Core,光追性能为51 TFLOPs。并拥有136个纹理单元,48个ROPs。基础频率2310 MHz,最高频率可达2535 MHz。后续OC版的GeForce RTX 4060 Ti 8G FE主要会在散热和GPU频率上做文章,以获得更高的效能。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

AD106-350-A1

值得说明GeForce RTX 4060 Ti 8G FE的L2缓存设计相对完整版AD106没有做任何缩减,同样是32MB容量,是RTX 3060 Ti的8倍。

更大的L2缓存有助于提高随机存取的命中率,而更快的L2缓存能提升运算单元的效率。内核在计算的过程中会不断的调用存储子系统的数据,顺序是L1缓存、L2缓存、显存、内存,越往后响应速度越慢。为了赶上快速刷新的游戏画面,GPU所有的数据会经过预加载放置在缓存中,因此缓存容量越大,下一帧所需要素材的命中率就越高,GPU跑腿寻找数据所需要的时间就更短,效率就更高。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

但由于紧贴着核心的L1缓存设计决定了存储空间不可能做得太大,提升L2缓存容量就称为了理想选择。因此我们就会看到GeForce RTX 4060 Ti 8GB FE在L2缓存空间相对RTX 3060 Ti增大8倍之后,命中率得到了大幅提升,需要从显存、内存中寻找素材的概率大幅缩减,从提升了整体性能。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

不仅如此,AD106中所有GPC都需要通过L2缓存完成所有访存操作,庞大的L2缓存搭配每个SM下包含的4个第四代Tensor Core,1个第三代RT Core,都将成为后续游戏实时光线追踪和DLSS 3性能提升的重要前提。这也是为什么,即使GeForce RTX 4060 Ti 8GB FE即使只是用了了128-bit 8GB DDR6显存,实际性能也仍然会明显提升。

事实上GeForce RTX 4060 Ti 8GB FE使用的GDDR6显存本身经过优化也有一定幅度提升,显存频率达到9000MHz,显存数据传输率为18Gbps,也明显优于RTX 3060 Ti的14Gbps的GDDR6。

最后我们将近几代GeForce RTX 60系列的GPU大致规格整理如下:

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

小巧的Founders Edition信仰

公版Founders Edition给机箱带来的沉稳格调在各式RGB AIC卡设计中独树一帜,但购买去到不多,比如GeForce RTX 4060 Ti 8GB Founders Edition国内官方购买渠道只能是去京东刷人品。相比GeForce RTX 4090 FE、RTX 4080 FE这些庞然大物而言,GeForce RTX 4060 Ti 8GB FE外形相当小巧,终于回归到了主流对显卡尺寸的认知。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

GeForce RTX 4060 Ti 8GB Founders Edition的长度控制在240mm左右,双槽位设计,不仅可以轻松安装到标准ATX机箱,或者诸如NUC Extreme这样的小型化机箱中。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

顶端的电源则与同门师兄一样沿用了最新的16pin(12VHPWR)接口,随机附送的是1个16pin转8pin的电源线,这样设计的目的是为了更好的适配新旧版电源,同时也表明了Founders Edition对新标准支持的态度。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在散热设计上,GeForce RTX 4060 Ti 8GB FE使用了与高端FE显卡相同的散热设计元素,包括前后双轴风扇、镂空的压铸件铝制散热片设计,GPU贴合底座使用了铜基座设计,通过热管将热量快速扩展到铝制散热片中,以提升冷却性能。Founders Edition的双轴风扇也提供了更好的气体流动性,能够提供比上一代提升20%的气体流动提升。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

前面对比表格中我们可以看到,GeForce RTX 4060 Ti 8GB FE的TGP为160W,但实际功耗要远低于此,NVIDIA给出的参考为,在闲置待机状态下,GeForce RTX 4060 Ti 8GB FE功耗为7W,使用AV1解码播放视频的功耗为13W,游戏平均功耗(AGP)为140W。

为此我们也统计了一些实际游戏中的显卡功耗,可见GeForce RTX 4060 Ti 8GB FE的能效比是非常高的。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

同时还得益于更高效能的8GB GDDR6,实际使用中也远低于RTX 4070 FE以上所使用的GDDR6X。因此在压力测试下,GPU核心温度为在69℃左右,红外线测温表现如下:

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

最后在接口配置上,GeForce RTX 4060 Ti 8GB FE则延续了GeForce RTX 40系列的配置,包括3个DisplayPort 1.4a和1个HDMI 2.1接口,实现多屏输出没有压力。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

目标1080p,火力全开

由于光线追踪技术的引入和主流3A大作的推崇,高分辨率运行全特效光追也意味着需要高昂的GPU成本。对于主流电竞显示器而言,1080p高刷新屏幕往往是兼顾性价比的最优选,而更多数玩家在升级的时候可能只会考虑GPU的单一配件升级,给GeForce RTX 4060 Ti 8GB FE定位1080p光追高画质提供了充足的理由。因此在测试中,我们将主要围绕1080p光线追踪最高画质进行。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在测试开始之前,让我们按照惯例放出测试平台,硬件阵营包括英特尔Core i9-13900K,七彩虹Colorful CNV DDR5-6000 16GB x2,ROG MAXIMUS Z790 HERO,Thermaltake TPI RGB PLUS 1250W,同时也引入上一代GPU作为对比。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在检验DirectX 11和DirectX 12项目中,主要使用3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal进行对比。GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的提升幅度在14%左右,相对GeForce RTX 2060 SUPER则提升50%到70%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

另外我们也注意到GeForce RTX 4060 Ti 8GB FE使用的是PCIe 4.0 x8通道,而非x16,在PCB针脚上我们也可以看到GeForce RTX 4060 Ti 8GB FE后半截是完全没有电路的。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

有同学会担心PCIe所提供代管数量不足。而实际上在早期旗舰级GPU也仅仅用足PCIe 3.0 x16,也仅仅相当于PCIe 4.0 x8,因此对于GeForce RTX 4060 Ti 8GB FE而言问题不大。这里不妨我们使用3DMark PCIe带宽测试作可以看到带宽为12.57GB/s,鉴于RTX 2080 Ti的PCIe 3.0 x16也没有吃满,GeForce RTX 4060 Ti同样带宽是可以接受的。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在常规的3A游戏中,与3DMark的测试结果类似,GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的平均提升幅度在18%左右,相对GeForce RTX 2060 SUPER则提升60%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

GeForce RTX 4060 Ti作为一款GeForce RTX 40系列GPU,DLSS 3无疑是重头戏。在DLSS技术推出近五年时间中,已经有超过300款应用和游戏提供支持,而DLSS 3发布数个月内,支持的游戏和应用已经超过30款,增长速度更快,提升效果也更明显。

简单的说DLSS 3是一套包含了提升游戏帧率、降低系统延迟的完整解决方案。它通过引入光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS 3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。

当然前提是,你必须要有一块GeForce RTX 40系列GPU中的第四代Tensor Core提供硬件支持,此前的Tensor Core最高只能支持到DLSS 2.X。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

而在3DMark DLSS功能测试中,我们就能看到DLSS 3的的优势了。在2K分辨率下GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的提升幅度近70%,相对GeForce RTX 2060 SUPER则提升130%。而在4K分辨率下,提升幅度更夸张,分别达到90%和170%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

鉴于GeForce RTX 4060 Ti主要针对1080p分辨率游戏,在实际的DLSS 3游戏测试中,着重在1080p最高光线追踪画质下进行。

例如在《巫师3:狂猎》荒野地形中对光线追踪的复杂场景处理提出了很高的要求,GeForce RTX 4060 Ti的提升幅度明显,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了80%和228%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

赛车游戏《F1 22》和《极限竞速:地平线5》自然是高帧率中流畅度和操控响应更能得到保障,GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了50%和100%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

有意思的是在《微软模拟飞行》中,GeForce RTX 4060 Ti拉开了很大的差距,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了100%和167%,主要得益于DLSS 3对地面建筑的优化。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

从整体而言,GeForce RTX 4060 Ti搭配DLSS 3在1080p分辨率下已经可以获得大幅度提升,在测试的几款游戏中,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER在平均帧率上分别提升了60%和150%以上。

但同时不要忘了DLSS 3本身是一套自带NVIDIA Reflex技术的方案,主要是解决利用AI插帧的时候避免关键操作和关键帧排在渲染序列尾端。目前已经有超过70款游戏和应用加入到了对Reflex的支持中。而在DLSS 2.X时代,这项技术需要单独开启。而在支持DLSS 3的游戏中,则是NVIDIA Reflex则是被默认开启,不需要单独设置的。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

因此可以看到在支持DLSS 3的高帧率游戏中,GeForce RTX 4060 Ti可以做到25ms左右的低延迟响应,而目前主流的十款射击类游戏中,也已经有8款游戏提供了对NVIDIA reflex的支持,比如《Apex英雄》, 《使命召唤: 战区2》, 《命运2》, 《逃离塔科夫》, 《堡垒之夜》,《彩虹六号:围攻》和《无畏契约》等。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

AI战斗力十足

GeForce RTX 4060 Ti 8GB FE的136个第四代Tensor Core其实非常值得一提,353 TFLOPs 的Tensor FP8/INT8稀疏度性能可以用来处理很多AI加速,甚至在16GB版本尚未发布之前,AI用户通过GeForce RTX 4060 Ti的纸面参数将其预判为下一张高性价比的AI加速显卡。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

让惯例搬出Stable Diffusion作为参考。这是一款在2022年推出的深度学习文本到图像转变的AICG工具,不但免费,还具备强大的扩展能力,例如提供一系列AI图片修复、文本提示引导图像,甚至是图像翻译等等。但前提是Stable Diffusion需要至少8GB以上的显存,GeForce RTX 4060 Ti 8GB FE正好符合这个需求。

这里我们利用一段固定的文字描述来引导Stable Diffusion 2.1为我们创建20张符合描述的建筑风景图片。在UI界面中设置GeForce RTX 4060 Ti同时运算2张图片,总共运行10次,即20张。每张图片分辨率为768×768分辨率,采样步数设置为50。

文字描述参考如下:

beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在对比中,我们使用RTX 2060 SUPER与RTX 3060 Ti进行比较,记录下每个GPU花费的时间,并进一步推算出每分钟生成的图像效率(Images Per Minute)。可以看到GeForce RTX 4060 Ti 8GB FE相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER在的AI效率分别提升了10%和42%,表现大致与GeForce RTX 3070 Ti持平,这也不免让人期待16GB版本的AI性能表现。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

还有一项AI测试是利用ON1 Resize AI 2022提升图片的原生分辨率,方便打印时的巨幅海报输出。在实际对比中,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti节省了17%左右的时间,相对GeForce RTX 2060 SUPER节省了将近50%的时间。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

即使没有内容创作需求,上个月发布的RTX Video SUPER Resolution(VSR)技术也会变成新的看片利器。如果你恰好有一个4K分辨率显示器,但只有1080p分辨率片源,通过NVIDIA控制面板-调整视频图像设置中的RTX视频增强,即可通过GeForce RTX 4060 Ti的AI性能增强播放质量。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在设置中,超分辨率质量分成4档,其中4档质量最高,但消耗资源也最多。在开启4档前提下,GeForce RTX 4060 Ti 8GB的消耗会来到80%以上,是真的火力全开来看片。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

与此同时,视频的播放画面也清楚了不少,这里我们将录制的一段1080p分辨率视频用支持VSR技术的VLC播放器进行对比,能够明显发觉在RTX VSR开启之后,广告牌,车身等原本模糊的细节有了质的变化。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

除了最新版的VLC播放器,RTX VSR还适用于Chrome和Edge浏览器中播放的所有视频内容。不过这项功能对GPU型号有限制,目前仅针对GeForce RTX 40或30系列GPU开放,注定了RTX 20系列以前的GPU无缘。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

创作力不容小视

GeForce RTX 4060 Ti 8GB FE的创作能力同样不容小视。接近于满配的AD106让其拥有1个NVENC和1个NVDEC,意味着GeForce RTX 4060 Ti拥有与GeForce RTX 4070一样的编解码能力,其中就包含AV1。这意味着AV1编码器能够利用现阶段可以进行1080p串流视频的带宽。同时掌握AV1编解码器也意味着GeForce RTX 4060 Ti 8GB无论是播放还是输出,都拥有不错的表现,其中AV1编码器能比H.264编码器效率高出40%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

在渲染输出方面,GeForce RTX 4060 Ti同样也保持着不错的战斗力。在利用V-Ray 5 Benchmark测试GPU的CUDA Core和光线追踪性能。可以看到,在CUDA Core性能上,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti提升11%,相对GeForce RTX 2060 SUPER提升164%。而在RTX性能中,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti提升15%,相对GeForce RTX 2060 SUPER提升129%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

Octane Render RTX是同样是测试GPU的光线追踪性能表现,在一个复杂场景下考验GPU每秒产生的样本率,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升11%,相对GeForce RTX 2060 SUPER平均提升73%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

Blender Benchmark主要检测了Moster、Junkshop、Classroom三个输出场景,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升30%,相对GeForce RTX 2060 SUPER平均提升75%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

最后是工程专业常见的SPECviewperf 2020。这是一款包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计领域的专业软件图形测试,包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。能够看到GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升9%,相对GeForce RTX 2060 SUPER平均提升27%。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

写在最后:性价比新尝试

从整体来看,GeForce RTX 4060 Ti 8GB给人不错的印象,在基础性能对比中,GeForce RTX 4060 Ti 8GB相对RTX 3060 Ti有不错的提升,而一旦涉及DLSS 3技术,无论是跑分还是体验都近乎是翻倍的。而对于RTX 2060 SUPER的用户而言,大可不必犹豫,GeForce RTX 4060 Ti 8GB带来性能成倍提升的酸爽。

而对于比GeForce RTX 2060 SUPER更老用户而言,GeForce RTX 4060 Ti 8GB在1080p分辨率下表现非常迅猛,无论是追求性价比换新机,还是在原有基础上升级的游戏玩家,亦或者希望在AI和创作上初尝试的创作者,GeForce RTX 4060 Ti 8GB在当下都是一个很好的选择。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

但要注意GeForce RTX 4060 Ti 8GB以及未来的两款RTX 4060系列都是用的是PCIe 4.0 x8通道,意味着GPU插在PCIe 4.0或者PCIe 5.0的卡槽上才能完全发挥性能。还在是用PCIe 3.0 x16槽主板的同学,可以考虑整机升级了。

随着NVIDIA与游戏工作室的不断合作,无论是主流电竞游戏还是3A大作,都将持续普及DLSS 3技术,在提升游戏帧率的同时还能降低系统延迟。如果希望在3000元档位选择一款玩得酸爽的GPU,GeForce RTX 4060 Ti 8GB确实是个不错的选择。当然,如果你有深度研究AI和内容创作的打算,则不妨可以期待一下显存更大的GeForce RTX 4060 Ti 16GB。GeForce RTX 4060 Ti 8GB则完全可以满足游戏、电竞和升级的需求了。

GeForce RTX 4060 Ti 8GB FE评测:DLSS 3再立功,1080p光追利器

#免责声明#

①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!

④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!

给TA打赏
共{{data.count}}人
人已打赏
数码硬件

首款天玑 9200 旗舰 vivo X90 开启官方降价,最高直降 300 元

2023-5-22 0:00:00

数码硬件

4090烧毁问题还存在,A750降至999元;京东方16K 110英寸显示器

2023-5-24 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索