如果查阅Steam硬件排行版,会发现NVIDIA的60系列GPU几乎屠榜显卡排行的TOP 10,与旗舰级GPU相同的技术与功能,再加上不错的性价比,成为主流机型的合理选择。
完整的AD106拥有3个GPC,有点类似于CPU中的3个独立核心,每个GPC同样包含了6组TPC,每组TPC包含2个流式多处理器(Streaming Multiprocessors,SM)。其中SM是可以看成诸多核心的集合体,从Maxwell架构开始引入了处理块(Sub-Core)概念。每个SM包含4个处理块,每个处理块包含1个64KB寄存器堆,1个L0指令缓存,1个Warp调度器,1个调度单元,4个加载/存储单元,1个特殊功能单元(Special Function Unit,SFU)用于执行超越函数指令(比如正弦、余弦、倒数、平方根等)和图形差值算法指令。
此外,每个SM下的128个CUDA Core随处理块分成4组,每组CUDA由16个专门用于FP32的CUDA Core,16个可以在FP32和INT32之间切换的CUDA Core组成。
多样的组合让AD106完整形态下拥有4608个Core Core、144个纹理单元,48个ROPs和36个SM,对应的,也拥有144个第四代Tensor Core和36个第三代RT Core。每个SM包含128KB L1缓存,总共拥有32MB L2缓存。
AD106
不过要注意的是,GeForce RTX 4060 Ti 8GB Founders Edition并非使用的是完整的AD106,它所用的版本为AD106-350-A1,GPC结构上没有做删减,同样使用了3个GPC,不过有一组GPC中屏蔽了1个TPC,即使少了2个SM。因此GeForce RTX 4060 Ti 8G FE拥有17个TPC,34个SM,4352个CUDA Core,从而着色器Shaders性能达到22 TFLOPs。
与此同时,GeForce RTX 4060 Ti 8GB FE还拥有136个第四代Tensor Core,Tensor FP8/INT8的稀疏度性能(Sparsity)达到353 TFLOPs,以及34个第三代RT Core,光追性能为51 TFLOPs。并拥有136个纹理单元,48个ROPs。基础频率2310 MHz,最高频率可达2535 MHz。后续OC版的GeForce RTX 4060 Ti 8G FE主要会在散热和GPU频率上做文章,以获得更高的效能。
AD106-350-A1
值得说明GeForce RTX 4060 Ti 8G FE的L2缓存设计相对完整版AD106没有做任何缩减,同样是32MB容量,是RTX 3060 Ti的8倍。
更大的L2缓存有助于提高随机存取的命中率,而更快的L2缓存能提升运算单元的效率。内核在计算的过程中会不断的调用存储子系统的数据,顺序是L1缓存、L2缓存、显存、内存,越往后响应速度越慢。为了赶上快速刷新的游戏画面,GPU所有的数据会经过预加载放置在缓存中,因此缓存容量越大,下一帧所需要素材的命中率就越高,GPU跑腿寻找数据所需要的时间就更短,效率就更高。
但由于紧贴着核心的L1缓存设计决定了存储空间不可能做得太大,提升L2缓存容量就称为了理想选择。因此我们就会看到GeForce RTX 4060 Ti 8GB FE在L2缓存空间相对RTX 3060 Ti增大8倍之后,命中率得到了大幅提升,需要从显存、内存中寻找素材的概率大幅缩减,从提升了整体性能。
不仅如此,AD106中所有GPC都需要通过L2缓存完成所有访存操作,庞大的L2缓存搭配每个SM下包含的4个第四代Tensor Core,1个第三代RT Core,都将成为后续游戏实时光线追踪和DLSS 3性能提升的重要前提。这也是为什么,即使GeForce RTX 4060 Ti 8GB FE即使只是用了了128-bit 8GB DDR6显存,实际性能也仍然会明显提升。
事实上GeForce RTX 4060 Ti 8GB FE使用的GDDR6显存本身经过优化也有一定幅度提升,显存频率达到9000MHz,显存数据传输率为18Gbps,也明显优于RTX 3060 Ti的14Gbps的GDDR6。
最后我们将近几代GeForce RTX 60系列的GPU大致规格整理如下:
小巧的Founders Edition信仰
公版Founders Edition给机箱带来的沉稳格调在各式RGB AIC卡设计中独树一帜,但购买去到不多,比如GeForce RTX 4060 Ti 8GB Founders Edition国内官方购买渠道只能是去京东刷人品。相比GeForce RTX 4090 FE、RTX 4080 FE这些庞然大物而言,GeForce RTX 4060 Ti 8GB FE外形相当小巧,终于回归到了主流对显卡尺寸的认知。
GeForce RTX 4060 Ti 8GB Founders Edition的长度控制在240mm左右,双槽位设计,不仅可以轻松安装到标准ATX机箱,或者诸如NUC Extreme这样的小型化机箱中。
顶端的电源则与同门师兄一样沿用了最新的16pin(12VHPWR)接口,随机附送的是1个16pin转8pin的电源线,这样设计的目的是为了更好的适配新旧版电源,同时也表明了Founders Edition对新标准支持的态度。
在散热设计上,GeForce RTX 4060 Ti 8GB FE使用了与高端FE显卡相同的散热设计元素,包括前后双轴风扇、镂空的压铸件铝制散热片设计,GPU贴合底座使用了铜基座设计,通过热管将热量快速扩展到铝制散热片中,以提升冷却性能。Founders Edition的双轴风扇也提供了更好的气体流动性,能够提供比上一代提升20%的气体流动提升。
前面对比表格中我们可以看到,GeForce RTX 4060 Ti 8GB FE的TGP为160W,但实际功耗要远低于此,NVIDIA给出的参考为,在闲置待机状态下,GeForce RTX 4060 Ti 8GB FE功耗为7W,使用AV1解码播放视频的功耗为13W,游戏平均功耗(AGP)为140W。
为此我们也统计了一些实际游戏中的显卡功耗,可见GeForce RTX 4060 Ti 8GB FE的能效比是非常高的。
同时还得益于更高效能的8GB GDDR6,实际使用中也远低于RTX 4070 FE以上所使用的GDDR6X。因此在压力测试下,GPU核心温度为在69℃左右,红外线测温表现如下:
最后在接口配置上,GeForce RTX 4060 Ti 8GB FE则延续了GeForce RTX 40系列的配置,包括3个DisplayPort 1.4a和1个HDMI 2.1接口,实现多屏输出没有压力。
目标1080p,火力全开
由于光线追踪技术的引入和主流3A大作的推崇,高分辨率运行全特效光追也意味着需要高昂的GPU成本。对于主流电竞显示器而言,1080p高刷新屏幕往往是兼顾性价比的最优选,而更多数玩家在升级的时候可能只会考虑GPU的单一配件升级,给GeForce RTX 4060 Ti 8GB FE定位1080p光追高画质提供了充足的理由。因此在测试中,我们将主要围绕1080p光线追踪最高画质进行。
在测试开始之前,让我们按照惯例放出测试平台,硬件阵营包括英特尔Core i9-13900K,七彩虹Colorful CNV DDR5-6000 16GB x2,ROG MAXIMUS Z790 HERO,Thermaltake TPI RGB PLUS 1250W,同时也引入上一代GPU作为对比。
在检验DirectX 11和DirectX 12项目中,主要使用3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal进行对比。GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的提升幅度在14%左右,相对GeForce RTX 2060 SUPER则提升50%到70%。
另外我们也注意到GeForce RTX 4060 Ti 8GB FE使用的是PCIe 4.0 x8通道,而非x16,在PCB针脚上我们也可以看到GeForce RTX 4060 Ti 8GB FE后半截是完全没有电路的。
有同学会担心PCIe所提供代管数量不足。而实际上在早期旗舰级GPU也仅仅用足PCIe 3.0 x16,也仅仅相当于PCIe 4.0 x8,因此对于GeForce RTX 4060 Ti 8GB FE而言问题不大。这里不妨我们使用3DMark PCIe带宽测试作可以看到带宽为12.57GB/s,鉴于RTX 2080 Ti的PCIe 3.0 x16也没有吃满,GeForce RTX 4060 Ti同样带宽是可以接受的。
在常规的3A游戏中,与3DMark的测试结果类似,GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的平均提升幅度在18%左右,相对GeForce RTX 2060 SUPER则提升60%。
GeForce RTX 4060 Ti作为一款GeForce RTX 40系列GPU,DLSS 3无疑是重头戏。在DLSS技术推出近五年时间中,已经有超过300款应用和游戏提供支持,而DLSS 3发布数个月内,支持的游戏和应用已经超过30款,增长速度更快,提升效果也更明显。
简单的说DLSS 3是一套包含了提升游戏帧率、降低系统延迟的完整解决方案。它通过引入光流加速器(Optical Flow Acceleration,OFA)与DLSS相结合的办法,构建出了一个更为立体的分析方式,将卷积自编码器的输入源扩展到几个部分,分别是:之前帧与当下帧,由光流加速器生成的光流场、游戏运动矢量和深度等数据。这时候DLSS 3甚至承担起渲染过程中7/8的工作,让CPU和GPU进完成其中1/8的渲染即可,从而节省出大量的计算资源专注到更有用的地方。
当然前提是,你必须要有一块GeForce RTX 40系列GPU中的第四代Tensor Core提供硬件支持,此前的Tensor Core最高只能支持到DLSS 2.X。
而在3DMark DLSS功能测试中,我们就能看到DLSS 3的的优势了。在2K分辨率下GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti的提升幅度近70%,相对GeForce RTX 2060 SUPER则提升130%。而在4K分辨率下,提升幅度更夸张,分别达到90%和170%。
鉴于GeForce RTX 4060 Ti主要针对1080p分辨率游戏,在实际的DLSS 3游戏测试中,着重在1080p最高光线追踪画质下进行。
例如在《巫师3:狂猎》荒野地形中对光线追踪的复杂场景处理提出了很高的要求,GeForce RTX 4060 Ti的提升幅度明显,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了80%和228%。
赛车游戏《F1 22》和《极限竞速:地平线5》自然是高帧率中流畅度和操控响应更能得到保障,GeForce RTX 4060 Ti相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了50%和100%。
有意思的是在《微软模拟飞行》中,GeForce RTX 4060 Ti拉开了很大的差距,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER分别提升了100%和167%,主要得益于DLSS 3对地面建筑的优化。
从整体而言,GeForce RTX 4060 Ti搭配DLSS 3在1080p分辨率下已经可以获得大幅度提升,在测试的几款游戏中,相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER在平均帧率上分别提升了60%和150%以上。
但同时不要忘了DLSS 3本身是一套自带NVIDIA Reflex技术的方案,主要是解决利用AI插帧的时候避免关键操作和关键帧排在渲染序列尾端。目前已经有超过70款游戏和应用加入到了对Reflex的支持中。而在DLSS 2.X时代,这项技术需要单独开启。而在支持DLSS 3的游戏中,则是NVIDIA Reflex则是被默认开启,不需要单独设置的。
因此可以看到在支持DLSS 3的高帧率游戏中,GeForce RTX 4060 Ti可以做到25ms左右的低延迟响应,而目前主流的十款射击类游戏中,也已经有8款游戏提供了对NVIDIA reflex的支持,比如《Apex英雄》, 《使命召唤: 战区2》, 《命运2》, 《逃离塔科夫》, 《堡垒之夜》,《彩虹六号:围攻》和《无畏契约》等。
AI战斗力十足
GeForce RTX 4060 Ti 8GB FE的136个第四代Tensor Core其实非常值得一提,353 TFLOPs 的Tensor FP8/INT8稀疏度性能可以用来处理很多AI加速,甚至在16GB版本尚未发布之前,AI用户通过GeForce RTX 4060 Ti的纸面参数将其预判为下一张高性价比的AI加速显卡。
让惯例搬出Stable Diffusion作为参考。这是一款在2022年推出的深度学习文本到图像转变的AICG工具,不但免费,还具备强大的扩展能力,例如提供一系列AI图片修复、文本提示引导图像,甚至是图像翻译等等。但前提是Stable Diffusion需要至少8GB以上的显存,GeForce RTX 4060 Ti 8GB FE正好符合这个需求。
这里我们利用一段固定的文字描述来引导Stable Diffusion 2.1为我们创建20张符合描述的建筑风景图片。在UI界面中设置GeForce RTX 4060 Ti同时运算2张图片,总共运行10次,即20张。每张图片分辨率为768×768分辨率,采样步数设置为50。
文字描述参考如下:
beautiful render of a Tudor style house near the water at sunset, fantasy forest. photorealistic, cinematic composition, cinematic high detail, ultra realistic, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting, ++dreamlike, vignette
在对比中,我们使用RTX 2060 SUPER与RTX 3060 Ti进行比较,记录下每个GPU花费的时间,并进一步推算出每分钟生成的图像效率(Images Per Minute)。可以看到GeForce RTX 4060 Ti 8GB FE相对GeForce RTX 3060 Ti和GeForce RTX 2060 SUPER在的AI效率分别提升了10%和42%,表现大致与GeForce RTX 3070 Ti持平,这也不免让人期待16GB版本的AI性能表现。
还有一项AI测试是利用ON1 Resize AI 2022提升图片的原生分辨率,方便打印时的巨幅海报输出。在实际对比中,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti节省了17%左右的时间,相对GeForce RTX 2060 SUPER节省了将近50%的时间。
即使没有内容创作需求,上个月发布的RTX Video SUPER Resolution(VSR)技术也会变成新的看片利器。如果你恰好有一个4K分辨率显示器,但只有1080p分辨率片源,通过NVIDIA控制面板-调整视频图像设置中的RTX视频增强,即可通过GeForce RTX 4060 Ti的AI性能增强播放质量。
在设置中,超分辨率质量分成4档,其中4档质量最高,但消耗资源也最多。在开启4档前提下,GeForce RTX 4060 Ti 8GB的消耗会来到80%以上,是真的火力全开来看片。
与此同时,视频的播放画面也清楚了不少,这里我们将录制的一段1080p分辨率视频用支持VSR技术的VLC播放器进行对比,能够明显发觉在RTX VSR开启之后,广告牌,车身等原本模糊的细节有了质的变化。
除了最新版的VLC播放器,RTX VSR还适用于Chrome和Edge浏览器中播放的所有视频内容。不过这项功能对GPU型号有限制,目前仅针对GeForce RTX 40或30系列GPU开放,注定了RTX 20系列以前的GPU无缘。
创作力不容小视
GeForce RTX 4060 Ti 8GB FE的创作能力同样不容小视。接近于满配的AD106让其拥有1个NVENC和1个NVDEC,意味着GeForce RTX 4060 Ti拥有与GeForce RTX 4070一样的编解码能力,其中就包含AV1。这意味着AV1编码器能够利用现阶段可以进行1080p串流视频的带宽。同时掌握AV1编解码器也意味着GeForce RTX 4060 Ti 8GB无论是播放还是输出,都拥有不错的表现,其中AV1编码器能比H.264编码器效率高出40%。
在渲染输出方面,GeForce RTX 4060 Ti同样也保持着不错的战斗力。在利用V-Ray 5 Benchmark测试GPU的CUDA Core和光线追踪性能。可以看到,在CUDA Core性能上,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti提升11%,相对GeForce RTX 2060 SUPER提升164%。而在RTX性能中,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti提升15%,相对GeForce RTX 2060 SUPER提升129%。
Octane Render RTX是同样是测试GPU的光线追踪性能表现,在一个复杂场景下考验GPU每秒产生的样本率,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升11%,相对GeForce RTX 2060 SUPER平均提升73%。
Blender Benchmark主要检测了Moster、Junkshop、Classroom三个输出场景,GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升30%,相对GeForce RTX 2060 SUPER平均提升75%。
最后是工程专业常见的SPECviewperf 2020。这是一款包含能源勘探、医学、建筑设计、机械设计、汽车设计、飞机设计领域的专业软件图形测试,包括包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等主流软件。能够看到GeForce RTX 4060 Ti 8GB相对GeForce RTX 3060 Ti平均提升9%,相对GeForce RTX 2060 SUPER平均提升27%。
写在最后:性价比新尝试
从整体来看,GeForce RTX 4060 Ti 8GB给人不错的印象,在基础性能对比中,GeForce RTX 4060 Ti 8GB相对RTX 3060 Ti有不错的提升,而一旦涉及DLSS 3技术,无论是跑分还是体验都近乎是翻倍的。而对于RTX 2060 SUPER的用户而言,大可不必犹豫,GeForce RTX 4060 Ti 8GB带来性能成倍提升的酸爽。
而对于比GeForce RTX 2060 SUPER更老用户而言,GeForce RTX 4060 Ti 8GB在1080p分辨率下表现非常迅猛,无论是追求性价比换新机,还是在原有基础上升级的游戏玩家,亦或者希望在AI和创作上初尝试的创作者,GeForce RTX 4060 Ti 8GB在当下都是一个很好的选择。
但要注意GeForce RTX 4060 Ti 8GB以及未来的两款RTX 4060系列都是用的是PCIe 4.0 x8通道,意味着GPU插在PCIe 4.0或者PCIe 5.0的卡槽上才能完全发挥性能。还在是用PCIe 3.0 x16槽主板的同学,可以考虑整机升级了。
随着NVIDIA与游戏工作室的不断合作,无论是主流电竞游戏还是3A大作,都将持续普及DLSS 3技术,在提升游戏帧率的同时还能降低系统延迟。如果希望在3000元档位选择一款玩得酸爽的GPU,GeForce RTX 4060 Ti 8GB确实是个不错的选择。当然,如果你有深度研究AI和内容创作的打算,则不妨可以期待一下显存更大的GeForce RTX 4060 Ti 16GB。GeForce RTX 4060 Ti 8GB则完全可以满足游戏、电竞和升级的需求了。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!