AMD发布MI350X和MI355X AI显卡,性能提升最高达4倍,推理速度加快35倍,功耗1400瓦
AMD在位于加利福尼亚州圣何塞的Advancing AI 2025活动上发布了两款新的AI GPU——MI350X和MI355X。根据AMD的说法,新加速器相对于上一代产品MI300X有了显著性能提升,最高可达3倍,这使得AMD在面对市场领先者Nvidia时更具竞争力。具体表现来说,AMD声称在类似推理基准测试中,MI350系列超过Nvidia的芯片达1.3倍,在某些训练工作负载中领先1.13倍。 这两款新GPU基于新一代的CDNA 4架构设计,与CDNA 3相比,不仅支持了新的FP4和FP6数据类型,而且采用更先进的工艺节点制造了计算芯片模块(chiplet)。这带来了显著的性能和内存带宽提高,也导致了更高的功耗需求。MI350X的设计更适合空气冷却系统,而MI355X则专门设计为液冷解决方案,旨在提供最高级别的计算能力。此外,这些新GPU提供了更多的HBM3E内存容量和更高的内存带宽,这有助于提升模型处理速度和精度。 在具体的硬件规格上,无论是MI350X还是MI355X均能配备高达288GB的HBM3E,并实现最高8TB/s的内存带宽。它们分别提供最大约18.45PFLOPS和20.1PFLOPS的FP4/FP6峰值性能,这一成绩优于Nvidia最新的B300 Ultra GPU。MI355X还实现了与Nvidia相比1.3X到1.13X的性能增益,特别是针对Llama 3.1等主流AI模型的推理由来明显。 为了实现这些性能提升,AMD对处理器核心部分进行了优化,每个计算模块包含32个计算单元,总共拥有256个计算单元。同时,新架构允许以更高效的方式组织I/O模块,减少了所需的I/O片段数量并将Infinity Fabric总线宽度翻了一番。这不仅提高了模块间的通信效率(达到1,075GB/s),还降低了不必要功率消耗,让更多电力可以用于计算任务而非其他组件。 除了硬件规格上的改进之外,AMD还在努力构建强大的合作伙伴生态系统,通过一系列收购加强了其在数据中心领域的能力。目前,Pegatron正在开发一款基于128个MI350X GPU的超级计算机,预计这将大大促进AMD产品在高密度计算环境中的应用。 在谈到未来方向时,AMD技术官Mark Papermaster表示,如果想在未来十年左右的时间内达到zetascale级别的计算能力,则必须在能效方面取得巨大进步。据他预测,超级计算机所需的最大功率可能将达到1400W甚至更高。为了维持这样的性能增长,除了架构上的突破之外,行业还需解决每FLOP对应内存带宽的问题。目前,AMD已经将其最新产品的内存带宽扩展至先前水平的两倍以上。但是,要想避免超算中心成为耗电巨兽,仍需持续提高能源利用率。 AMD是一家全球领先的半导体科技公司,以其先进的CPU和GPU而知名。随着人工智能领域的快速崛起,该公司加大了对AI专用芯片的研发力度,通过引入新的FP4/FP6等低精度运算支持,旨在为AI训练和推理任务提供优化方案。此次发布的MI350X系列标志着AMD在其AI战略上的又一次重要进展,同时也表明了AMD正逐渐缩小与Nvidia的差距。然而,对于大规模部署而言,能耗问题依旧是亟待解决的一大挑战。