(资料图)
财联社2月4日电,腾讯混元AI Infra团队正式推出开源生产级高性能LLM推理核心算子库 HPC-Ops。在真实场景下,基于HPC-Ops,混元模型推理 QPM 提升30%,DeepSeek模型 QPM 提升17%。同时,在单算子性能方面,HPC-Ops实现Attention相比 FlashInfer/FlashAttention 最高提升2.22倍;GroupGEMM 相比 DeepGEMM 最高提升1.88倍;FusedMoE 相比 TensorRT-LLM 最高提升1.49倍。
[责任编辑:linlin]
腾讯混元AI Infra核心技术开源:推理吞吐提升30%-焦点滚动
别人眼中的好机会,出麦丹就能换回字母哥,这笔交易森林狼该做吗 快消息
内房股午后普遍上涨 龙光集团涨逾7%华润置地涨逾5% 焦点滚动
和铂医药-B盈喜后高开逾3% 预期年度溢利至多约9500万美元-速看料
出口激增推动人民币9个月升值6%,12月汇率预期6.92美元
郑中设计:拟使用不超5.5亿元闲置自有资金购买理财产品-每日聚焦
新华指数|采购商心态谨慎 干辣椒价格指数小幅下跌
C罗旗下媒体:C罗在球队生活不如意!他可能去美国大联盟!
信息:宁德时代、深蓝汽车、长安汽车合资公司注册资本增至40亿元
每日观点:星际荣耀完成上箭状态发动机与星控三号联合匹配试车 SQX-3火箭首飞再进一步
苏豪时尚:近年公司有向欧洲出口的业务_焦点快看
张家界国资、凯撒旅业等成立文旅公司