英伟达现已发布 RTX 4060 Ti 8G 显卡,其显存位宽只有 128bit。相比之下,英伟达老款 RTX 3060 Ti 为 256bit 位宽,RTX 3060 也有 192bit 位宽。
对此,英伟达在一篇博客文章中进行了解答,称与具有 128 位显存位宽的上一代 GPU 相比,全新 NVIDIA Ada Lovelace 架构的存储子系统将 L2 缓存的大小增加了 16 倍,极大提高了缓存命中率。
如上图所示,Ada GPU 中的 L2 缓存带宽已显著增加。这使得在处理核心和 L2 缓存之间传输更多数据成为可能。
此外,英伟达工程师测试了具有 32 MB L2 缓存的 RTX 4060 Ti 与仅使用 2 MB L2 的 RTX 4060 Ti 的特殊测试版本。
在各种游戏和综合基准测试中,与 2 MB 二级缓存的性能相比,32 MB 二级缓存将显存总线流量平均降低了 50% 以上。这种 50% 的流量减少使 GPU 能够更有效地使用其显存带宽,效率提升可达近 2 倍。因此,在这种情况下,隔离显存性能,具有 288 GB / 秒峰值显存带宽的 Ada GPU 的性能与具有 554 GB / 秒峰值显存带宽的 Ampere GPU 的性能相似。在一系列游戏和综合测试中,大大提高的缓存命中率将游戏帧率提高了高达 34%。
英伟达称,从历史上看,显存位宽一直被用作确定新 GPU 的速度和性能等级的重要指标。然而,显存位宽本身并不能充分表明存储子系统的性能。相反,更全面地了解存储子系统设计及其对游戏性能的整体影响是有帮助的。
由于 Ada 架构的优势,包括新的 RT 和 Tensor 核心、更高的时钟速度、新的 OFA 引擎和 Ada 的 DLSS 3 功能,GeForce RTX 4060 Ti 比上一代采用 256 位的 GeForce RTX 3060 Ti 和 RTX 2060 SUPER 显卡更快,同时功耗更低。
IT之家整理 RTX 4060 Ti 和 RTX 4060 显卡参数信息如下:
RTX 4060 Ti 拥有 4352 CUDA 核心,配备 8GB / 16GB 128bit GDDR6 显存,TGP 功耗 160W / 165W,采用 PCIe 4.0*8 连接,售价 3199 元起,5 月 24 日开卖。
RTX 4060 显卡拥有 3072 CUDA 核心,配备 8GB GDDR6 128bit 显存,功耗 115W,采用 PCIe 4.0*8 连接,售价 2399 元起,7 月上市。
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!