110万美元悬赏!AMD发起全球战书:谁能打破DeepSeek与Kimi的推理速度极限?
在DeepSeek-R1和Kimi K2.5等顶级开源模型确立了万亿参数的工业基准后,真正的极限性能压榨才刚刚开始。谁能在极高并发下打破内存墙?谁能用最优雅的代码实现最高效的算子重构?在当下的AI战场,速度即是正义,吞吐量决定生死。由AMD与GPU MODE联合发起的极客巅峰对决,正式向全球发榜:2026线上黑客松:AMD E2E Model Speedrun正式吹响集结号!
·在这里,你将直接操控AMD专为大模型打造的顶配云端GPU阵列
·在这里,没有纸上谈兵的PPT,只有硬核的绝对速度与吞吐量。
·在这里,你的极限优化不仅能赢取巨额美金,更将直接合入主流开源框架,定义下一代AI推理的工业标准!
作为本次活动的战略社区合作伙伴,CSDN将全程见证这场智力与算力的巅峰对决。
你,敢来迎战吗?

立即报名:AMD×GPU MODE - E2E Model Speedrun • Luma
(https://luma.com/cqq4mojz?utm_campaign=adp-aig&utm_medium=social&utm_source=csdn&utm_term=hackathon)
百万美金奖池,凭实力“拿钱”
本次挑战赛设立了高达110万美元的总奖金池!只要你的技术够硬,名与利双丰收。
决赛入围奖:只要从预选赛杀出重围,跻身Top 10.每支队伍保底斩获10.000美金!
Track 1赛道桂冠(DeepSeek-R1-0528):$350.000独揽!
Track 2赛道桂冠(Kimi K2.5 1T FP4):$650.000独揽!
注:两大赛道完全独立,有实力的团队完全可以双线作战,包揽百万美金!
赛制硬核,分秒必争的“大逃杀”
·比赛绝非易事,本次大赛将采用“底层算子突围+端到端决赛大考”的双阶段赛制。能留到最后的,注定是地表最强的性能架构师。
·预选赛——底层内核的绝对厮杀
所有参赛者需对三大核心GPU算子进行极限打磨:
1、MXFP4 MoE(最高1500分)
2、MLA Decode(最高1250分)
3、MXFP4 GEMM(最高1000分)每个内核问题的得分=最大分值×[1-(排名分值/20)]。排名按顺序所对应分值=0.1.2.…18.19.总分为三项内核问题得分之和,采用上述方法。只有排名前20的算子才能获得积分,总分排名前10的战队/个人,方可拿到通往决赛的门票。
总决赛——真实世界的端到端狂飙
Top 10 选手将获得 AMD 提供的单节点8卡云端Instinct™ GPU集群。你们需要在极致并发下,挑战两大明星模型:
·赛道 1:DeepSeek-R1-0528 FP4 + MTP
·赛道1评判标准

在4、32、128三种并发度下,你不仅要保证极高的吞吐量(Token Throughput),还要死守低延迟的交互性(Interactivity),更要确保模型精度不能掉(本赛道要求GSM8K≥0.93)。性能门槛(三个并发级别必须同时达标):
·赛道2:Kimi K2.5 1T FP4
·赛道2评判标准
在4、32、128三种并发度下,你不仅要保证极高的吞吐量(Token Throughput),还要死守低延迟的交互性(Interactivity),更要确保模型精度不能掉(如Track 1要求GSM8K≥0.93)性能门槛(三个并发级别必须同时达标):

评分:Token Throughput per GPU(最高600分)+Interactivity(最高400分),三个并发级别满分3000分。
跑分不是终点
我们寻找的不是为了跑分的“特供版代码”,而是能真正造福全人类AI社区的工业级优化。终极必杀规则:代码必须可Merge!所有具备获奖资格的团队,其提交的代码必须在赛后2-4周内,在AMD工程师的指导下,成功向AMD官方仓库(AMD ATOM / vLLM / SGLang)发起Pull Request并完成合并。让你的名字,永远镌刻在推动大模型时代前行的开源主分支上!
决战时刻表(北京标准时间)
·报名&预选赛截止时间:4月7日2:59 PM(TOP 10诞生)
·决赛排位战:4月8日0:00 AM——5月16日2:59 PM
·全球颁奖典礼:5月19日
如何加入这场算力狂欢?
无论你是AI底层优化老兵、CUDA/Triton极客,还是系统架构师、开源社区贡献者,只要你对AI系统性能工程充满狂热,这里就是你的主场!(支持个人或至多3人组队参赛)
第一步:加入AMD AI Developer Program,获取官方弹药库。
AI开发者计划注册表:https://www.amd.com/zh-cn/registration/ai-dev-program-sign-up-form.html
第二步:查阅预选赛参考kernels,使用Popcorn CLI准备你的提交。预选赛入口及工具库:https://github.com/gpu-mode/reference-kernels,别一个人战斗!立刻加入GPU MODE Discord社区及微信比赛专属群,与全球顶尖开发者同频共振,获取实时赛事更新与官方技术支持!
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
刘烈宏:以高质量数据赋能AI创新,加快培育智能经济新形态
当前,人工智能发展正经历着一场前所未有的加速演进,一个又一个热点事件接连涌现。在技术创新与商业应用的双轮驱动下,人工智能产业规模持续增长,从去年春节DeepSeek开源模型出圈,到机器..[详细]
AI赋能中小企业仍处于初期探索阶段
新一代人工智能正在全球范围蓬勃兴起,成为新一轮科技革命和产业变革的战略性技术和重要驱动力量。开展人工智能赋能中小企业高质量发展研究,既是人工智能技术推进规模化商业化应用、加速向..[详细]
华为启动“乾坤 · 众智同行”计划:与伙伴共同创造、共同受益,把中国方案带向世界
AI大潮汹涌而来,千行百业都在向云端、向智能化迁移,期待新的ICT技术方案能够带来更高的工作效率、更好的服务品质、更理想的用户体验。不过每个行业的应用场景不同,每个企业的服务对象和市..[详细]
5G-A大上行成产业共识,差异化体验赋能行业升级
数据显示,截止2026年1月,全球已有374个运营商部署5G网络,为各国用户提供了更好的体验,也涌现了很多新的需求,比如高清直播需要大上行,人群密集场所需要大容量,工业智能化需要低时延等..[详细]
6G时代的智能设备:反思自身、协同彼此、共同推理
经历了MWC26,很多人都对6G有了更加直观的认识,如同5G时代的高速率、低时延、广连接,6G给出的答案是连接、广域感知和高性能计算。不过,正如5G当初所畅想的智能工厂与万物互联,6G自然也需..[详细]
黄仁勋:需要更多Token与工程师,这是AI革命的开工典礼
3月17日,在美国加州圣何塞开幕的GTC 2026大会上,英伟达创始人兼CEO黄仁勋开始了备受瞩目的主题演讲。来看他演讲的观众需要排队,现场人山人海。这场演讲不仅有黄仁勋对过去二十年技术积累..[详细]
我国算力规模与质量协同跃升,行业赋能效益加速释放
当前,以大模型为代表的人工智能应用驱动全球计算技术进入新一轮创新爆发期,先进计算硬件、软件、算法之间深度融合、协同演进,量子计算、类脑计算等前沿计算架构加快突破,算力需求呈现指..[详细]
如何推进算电协同,筑牢绿色高效硬底座?
随着AI浪潮的快速发展推进,全社会对算力的需求持续扩大,今年的《政府工作报告》也重点提出,要深化拓展“人工智能+”,实施超大规模智算集群、算电协同等新基建工程。在AI算力需求井喷的..[详细]
平时不戴眼镜的高通卡图赞,谈可穿戴设备杀手级AI应用
“我本人不戴眼镜,只在户外戴太阳镜。所以对我来说,可能挂坠或项链这类形态会更舒服,我可以戴在胸前,随时都能完成视觉交互。”卡图赞随后又以个人视角表..[详细]













