锐龙7700X是一个性价比较高的处理器,目前售价降至1999元
Anycubic的PhotonUltra树脂3D打印机现在售价也下降到了仅1599元
罗技G413TKLSE机械键盘降价至399元,采用TenKeyLess布局,去除小键盘以减小键盘面积,但功能和导航键依旧保留,并且采用龙华棕轻触开关,带有PBT键帽和背光,配备6键无冲功能,同时按下多个键所有的按键动作都会被记录下来
此外,AMD Instinct MI300显卡细节浮出水面,在2 Exaflop的ElCapitan超级计算机中首次亮相
MI300是AMD的一款数据中心显卡,CPU和核心以及大量高速显存集成在同一个PCB上,但目前已知细节仍然很少。2exaflop的ElCapitan超级计算机在国际超级计算(ISC)2023文稿中提交了一些新细节,该文稿讲解了即将推出的由Instinct MI300提供支持的超算,研究巨头imec主办的ITF2023上,AMD首席技术官Papermaster也说明了具体信息
ElCapitan超算将在2023年底启动,是2023年最快的超级计算机,取代当前最快的超算Frontier,AMD的Instinct MI300细节如下,包括MI300的拓扑图、MI300实验室的图片,以及在ElCapitan超级计算机中使用的新刀片的图片,还有围绕ElCapitan部署的一些新开发
MI300是一个数据中心显卡,它混合了总共13个小芯片,其中许多都是3D堆叠芯片,还有一个24核Zen4架构的CPU,单芯片封装,融合了一个CDNA3图形引擎和8个总计128GB的HBM3显存堆栈总体,1460亿个晶体管,是AMD投入生产的最大芯片。九个计算裸片混合了5nm制程CPU和显卡,以3D方式堆叠在四个6nm基础裸片之上,这些裸片是处理内存和I/O流量以及功能的,具有源中介层
ITF的重点关注为30×25目标,即到2025年时能效提高30倍。随着科技放缓,计算现在受到能效的限制,该计划的关键是Instinct MI300,它的大部分成效面采用了简化系统拓扑
之前的MI250显卡是一个独立的显卡,需要有一个霄龙CPU来协调工作负载
相比之下,MI300包含一个内置的24核Zen4架构霄龙Genoa处理器,从而等式删除独立CPU,相同的整体拓扑不需要独立的CPU(也可以加装),从而实现了四个元素的完全连接的all-to-all拓扑,这种类型的连接允许所有处理器直接相互对话,而无需CPU或显卡作为中介数据中继到元素,从而减少延迟和可变性。这是MI250拓扑的一个潜在痛点,MI300的拓扑图显示,每个芯片有三个连接,就像MI250上看到的那样,Papermaster的出现还形成了基模的有源中介层,称为第四代Inifity Fabric基模
在AMD的规划路线中,MI300使AMD走向一条清晰的道路,可以超越30X25效率目标,同时也超越功耗趋势,下面是一些亲眼看到的Instinct MI300芯片图片,在ElCapitan服务器里的外观
在ISC2023上,劳伦斯利弗莫尔国家实验室(LLNL)的首席技术官Bronis R.de Supinski就MI300 APU集成到ElCapitan超级计算机中发表回应,称使用ElCapitan进一步推进核技术用途
用于ElCapitan系统的单刀片式服务器由系统供应商HPE制造,在一个纤薄的1U机箱中配备了四个水冷MI300显卡,MI300在机房内被称为MI300A,但不确定这是ElCapitan的定制型号还是更正式的编号
MI300带有无限缓存,但没有具体说明可用容量,Supinski还多次提到单一内存层的重要性,统一内存空间,如何简化编程,降低不同类型计算和不同内存池之间数据移动的复杂性
MI300可以在多种不同模式下运行,但主要模式由单个内存域和NUMA域组成,从而为所有CPU和核心提供统一的访问内存,关键要点是缓存一致性,内存减少了CPU和显卡之间的数据移动,比计算本身消耗更多的功耗,从而减少延迟提高性能和功耗效率。从Sierra超级计算机移植到ElCapitan上相对容易
HPE正在研发基于Shasta架构和Slingshot-11网络互连的ElCapitan系统,提供同一平台,为能源部的百亿亿级超级计算机、超级计算机Frontier和经常延迟的Aurora英特尔芯片提供支持
NNSA需要建造更多的基础设施来同时运行Sierra超级计算机和ElCapitan超级计算机,这项工作包括专用于计算的功耗传输从45MW提高到85MW,散热系统可额外提供15兆瓦的功耗,通过增加新的18000吨散热塔,散热系统也已升级为28000吨,为该站点提供了总计100兆瓦的电力,ElCapitan消耗不到40兆瓦,实际值为30兆瓦,具体数值在部署前不得而知
ElCapitan使用NNSA定制的Tri-lab操作系统软件(TOSS)和先进技术系统(ATS),基于RHEL的完整软件堆栈
LLNL使用较小的EAS3系统来验证,在今年下半年投入运营,部署在ElCapitan上的软件LLNL已经在测试新的Rabbit模块,这些模块托管大量用于近节点本地存储的硬盘面,但它不使用MI300显卡。相反,进行存储编排和数据分析任务的标准霄龙服务器处理器可以为这些快速节点充当突发缓冲区,快速吸收大量传入数然后这些数据转移到较慢的大容量存储系统
随着开发继续以可预测的节奏进行,很明显ElCapitan正在顺利进行,今年下半年投入运营,MI300为高性能计算开辟了一条新道路,但这些MI300芯片非常昂贵,且相对稀有。这些不是大批量生产的,因此它不会像霄龙那样得到广泛关注,部署Genoa数据中心CPU的技术也可以过滤到不同外形的多种型号下
该芯片还与英伟达的Grace Hopper Superchip竞争,英伟达的做法则是在同一块板上结合了Hopper显卡和Grace CPU,这些芯片于今年上市,基于Neoverse的Grace CPU支持Armv9指令集,且配备了两个与英伟达新品牌NVLink-C2C互连技术融合在一起的芯片。相比之下,这种方法提供卓越的浮点性能和能源效率,因为这些设备组合到一个封装中通常可以在单元之间实现更高的浮点性能,而不是像GraceHopper那样连接到两个单独的设备
MI300本该与英特尔的FalconShores竞争,但英特尔的芯片最初设计为不同数量的计算块,x86核心、核心和多种配置的内存,由于推迟到2025年,这让MI300没有英特尔这个直接竞争对手
#免责声明#
①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。
②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。
③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!
④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。
⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!