首页|必读|视频|专访|运营|制造|监管|芯片|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|大数据|报告|智慧城市|移动互联网|会展

首页 >> 移动互联网 >> 正文

北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

2025年7月28日 17:05 CCTIME飞象网

在人工智能领域，大语言模型的训练与推理成本一直是限制技术普及的关键因素之一。近日，北京大学人工智能研究院助理教授张牧涵团队在鲲鹏昇腾科教创新卓越中心（简称“卓越中心”）提供的算力支持下，成功研发出一套高效的大模型训练推理架构，实现了百万tokens输入成本低至1元，为产业提供了高效能、低成本的解决方案。

此研究成果包括三项关键技术创新。首先，目前广泛使用的相对位置编码存在较大的稀疏性，团队通过将每个注意力头中的位置信息和非位置信息分离，对位置编码进行了低秩压缩，仅使用3%的位置信息，即可维持原有表达能力。该方法通过优化昇腾硬件的flash-attention算子，使得注意力头的参数得到更高效利用。

第二，非位置编码信息在原始模型中通常处于被抑制状态。通过将位置编码与非位置编码分离，非位置编码得到了较大的压缩空间。团队采用了联合KV的低秩压缩方法，仅保留12.5%的KV Cache即可维持原始模型的能力。这一方法能够有效利用昇腾硬件高效的计算能力，减轻访存压力，显著提升推理效率。

最后，基于昇腾硬件在出色的并行计算能力，团队实现的Recurrent Decoding（RD）技术通过替换LM-head提升了训练数据利用率并加速了推理。在训练阶段，RD通过将解码出的多个tokens与target tokens进行对比，实现了训练数据的高效利用；在推理阶段，结合投机推理显著提高了tokens的采样通过率，进而提升了推理速度。

这一成果得到了学术界的广泛关注，不仅为科研提供了可复用的高效架构，也为AI大模型在企业中的应用大幅降低了成本。自去年6月成立以来，北京大学与华为在产业前沿课题的联合攻关持续推进，本次成果验证了昇腾算力平台支撑尖端科研的技术实力。卓越中心将继续深入开展大模型关键技术创新，为构建中国技术生态提供坚实支撑。

编辑：T01

飞象网版权及免责声明:
1.本网刊载内容，凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有，未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载，请必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和飞象网来源。
2.凡注明“来源：XXXX”的作品，均转载自其它媒体，在于传播更多行业信息，并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题，请在相关作品刊发之日起30日内与本网联系，我们将第一时间予以处理。
本站联系电话为86-010-87765777，邮件后缀为cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。

推荐新闻

·中国联通成功举办 2025世界人工智能大会“AI+制造”发..	·中国移动副总经理李慧镝：筑智能云网共赢数智未来促智..
·WAIC嘉宾热议AI应用，痛点挖掘成技术落地“隐形分水岭”	·AI智启融合无界中国联通精彩亮相2025世界人工智能大会
·中国移动与中国数联物流签署战略合作协议	·中国移动正式揭牌人工智能新型专业化机构，目标打造一..
·中国移动倾力建设人工智能“焕新社区”，为我国AI产业..	·中国移动董事长杨杰：深入实施“AI+”行动全面赋能产..
·以“星辰”绘就AI共治共享图景中国电信WAIC 2025亮点..	·智焕新生，共创AI+时代：中国移动全景描绘数智未来
·WAPI产业联盟召开2025年第二次标准工作和项目组会议（..	·中兴通讯董事长方榕：AI普惠、绿色低碳，共绘数字丝路..
·尚冰提出四点发展建议,推动互联网行业高质量发展	·国新办就2025年上半年工业和信息化发展情况举行新闻发布会

人物

中兴通讯总裁徐子阳：智联共生数实融合

·尚冰提出四点发展建议,推动互联网..

·中国移动副总经理程建军：数智创..

·邬贺铨：人工智能从生成式大模型..

·中国移动董事长杨杰：聚“AI＋”..

·高通孟樸：终端侧AI，开启“芯”增长

·高通侯明娟：推动技术创新与产业..

精彩视频

中国电信总经理刘桂清：星辰智惠，共治共享，赋能产业变革新未来

中国电信柯瑞文：打造全方位人工智能动态防护体系，构建共创、共治、共享的产业生态

2025世界人工智能大会：才艺比拼、技能比武！机器人“大显身手”

青蓝对话｜通用人工智能的技术基础拼图

精彩专题

2025世界人工智能大会暨人工智能全球治理高级别会议

2025中国联通合作伙伴大会

2025 MWC 上海

2025工业互联网大会

关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图

CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1 电信与信息服务业务经营许可证080234号京公网安备110105000771号
公司名称：北京飞象互动文化传媒有限公司
未经书面许可，禁止转载、摘编、复制、镜像