HyperAI超神经

AMD在位于加利福尼亚州圣何塞的Advancing AI 2025活动上发布了两款新的AI GPU——MI350X和MI355X。根据AMD的说法，新加速器相对于上一代产品MI300X有了显著性能提升，最高可达3倍，这使得AMD在面对市场领先者Nvidia时更具竞争力。具体表现来说，AMD声称在类似推理基准测试中，MI350系列超过Nvidia的芯片达1.3倍，在某些训练工作负载中领先1.13倍。这两款新GPU基于新一代的CDNA 4架构设计，与CDNA 3相比，不仅支持了新的FP4和FP6数据类型，而且采用更先进的工艺节点制造了计算芯片模块（chiplet）。这带来了显著的性能和内存带宽提高，也导致了更高的功耗需求。MI350X的设计更适合空气冷却系统，而MI355X则专门设计为液冷解决方案，旨在提供最高级别的计算能力。此外，这些新GPU提供了更多的HBM3E内存容量和更高的内存带宽，这有助于提升模型处理速度和精度。在具体的硬件规格上，无论是MI350X还是MI355X均能配备高达288GB的HBM3E，并实现最高8TB/s的内存带宽。它们分别提供最大约18.45PFLOPS和20.1PFLOPS的FP4/FP6峰值性能，这一成绩优于Nvidia最新的B300 Ultra GPU。MI355X还实现了与Nvidia相比1.3X到1.13X的性能增益，特别是针对Llama 3.1等主流AI模型的推理由来明显。为了实现这些性能提升，AMD对处理器核心部分进行了优化，每个计算模块包含32个计算单元，总共拥有256个计算单元。同时，新架构允许以更高效的方式组织I/O模块，减少了所需的I/O片段数量并将Infinity Fabric总线宽度翻了一番。这不仅提高了模块间的通信效率（达到1,075GB/s），还降低了不必要功率消耗，让更多电力可以用于计算任务而非其他组件。除了硬件规格上的改进之外，AMD还在努力构建强大的合作伙伴生态系统，通过一系列收购加强了其在数据中心领域的能力。目前，Pegatron正在开发一款基于128个MI350X GPU的超级计算机，预计这将大大促进AMD产品在高密度计算环境中的应用。在谈到未来方向时，AMD技术官Mark Papermaster表示，如果想在未来十年左右的时间内达到zetascale级别的计算能力，则必须在能效方面取得巨大进步。据他预测，超级计算机所需的最大功率可能将达到1400W甚至更高。为了维持这样的性能增长，除了架构上的突破之外，行业还需解决每FLOP对应内存带宽的问题。目前，AMD已经将其最新产品的内存带宽扩展至先前水平的两倍以上。但是，要想避免超算中心成为耗电巨兽，仍需持续提高能源利用率。 AMD是一家全球领先的半导体科技公司，以其先进的CPU和GPU而知名。随着人工智能领域的快速崛起，该公司加大了对AI专用芯片的研发力度，通过引入新的FP4/FP6等低精度运算支持，旨在为AI训练和推理任务提供优化方案。此次发布的MI350X系列标志着AMD在其AI战略上的又一次重要进展，同时也表明了AMD正逐渐缩小与Nvidia的差距。然而，对于大规模部署而言，能耗问题依旧是亟待解决的一大挑战。

相关链接

相关链接

相关链接

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

Command Palette

AMD发布MI350X和MI355X AI显卡，性能提升最高达4倍，推理速度加快35倍，功耗1400瓦

相关链接

Command Palette

AMD发布MI350X和MI355X AI显卡，性能提升最高达4倍，推理速度加快35倍，功耗1400瓦

相关链接

Command Palette

AMD发布MI350X和MI355X AI显卡，性能提升最高达4倍，推理速度加快35倍，功耗1400瓦

相关链接

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间

验证周期缩短 40 倍，密歇根大学等提出电池寿命预测新方法，「发现学习」节省 98% 评估时间