找回密码
 立即注册

QQ登录

只需一步,快速开始

  • QQ空间
  • 回复
  • 收藏
1 月 26 日消息,AMD 上周正式发布了 ROCm 开源软件堆栈的 7.2.0 版本。这一版本新增了对多款新硬件的正式支持,并优化了 Instinct MI350 系列与 MI300X 显卡加速器的 AI 表现。
推荐系统:win11系统下载
AMD ROCm 7.2.0 正式发布:支持多款新硬件,优化 Instinct AI 性能
1.jpg
具体来看,ROCm 现已正式支持 AMD Radeon AI PRO R9600D、Radeon RX 9060 XT LP、Radeon RX 7700 三款独立显卡和最近推出的锐龙 AI 400 系列处理器。


同时,这一版本在 Instinct MI355X 上显著提升了 Meta Llama 3.1 405B 模型的推理表现,通过内核级调优和内存带宽提升实现了吞吐量提升和延迟降低;优化了 Llama 3 70B 和 Llama 2 70B 在 MI355X、MI350X 上的性能;在 MI300X 上优化智谱 GLM-4.6 的 GEMM 算子性能和 DeepSeek 的 DeepEP 开源通信库表现。


ROCm 7.2.0 还包含其它一系列改进,包括提升 HIP 运行时性能、新增对多 GPU 节点的节点电源管理等。

青苹果系统官网:www.pggho.com
发表评论
登录后参与评论 / 立即注册
用户反馈
QQ群