当前位置:主页 > 生活 > 正文
腾讯混元AI Infra核心技术开源:推理吞吐提升30%-焦点滚动
来源:财联社作者:洞察网2026-02-04 19:32:29


(资料图)

财联社2月4日电,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。

[责任编辑:linlin]

标签: 混元 推理 算子 腾讯 hpc 技术开源 知名企业 infra 高吞吐量内核

相关文章

评论排行
评论排行
热门话题
最近更新