英伟达200亿押错了?LPU只是过渡,3D-CIM™️才是终局
这两年消费电子圈,没点AI功能都不好意思开发布会。IDC最新Q1数据显示,全球AI手机出货占比已破45%,同比翻了两倍多,AI PC年底渗透率更是要冲60%。但剥开营销话术,真实的用户体验完全是冰火两重天。
你以为手机上的“端侧AI”是真本地跑大模型?十台里八台都是把你的提问传到云端算完再发回来,但是你的隐私就得全靠厂商“良心”,更躲不开未来的Token付费——现在免费是厂商烧钱抢市场,等野蛮期过去,一个月AI对话花的钱比话费还贵,是板上钉钉的事。
号称“真本地AI”的AI PC更尴尬。我同事刚买的新款联想AI PC,冲着长续航办公买的,结果开会用电池半天就没电,最后查到是后台AI Agent偷偷跑推理吃功耗,一关功能续航直接翻倍。现在能本地跑7B大模型的AI PC,一开AI功能功耗就拉满,所谓的移动生产力,最后还得插着电源用。
一边是云端的隐私焦虑和付费压力,一边是本地的功耗噩梦和续航崩盘,端侧AI始终卡在“鱼和熊掌不能兼得”的死局里,端边云全场景的AI推理,都困在“高性能+低功耗+低成本”的不可能三角里。就在全行业找答案的时候,英伟达甩出200亿美元全资收购Groq,一夜之间,全行业都在喊:GPU时代过去了,LPU才是AI推理的未来。
但LPU真的是终局吗?或者说,有没有一种技术,比LPU走得更彻底,能从根上破了这个不可能三角?
1. 英伟达200亿押注的LPU,到底解决了什么?又没解决什么?
先给大家打个最通俗的比方:大模型推理就像开餐馆炒菜,传统冯・诺依曼架构里,计算单元是灶台,存储单元是10公里外的食材仓库。炒一道菜,80%的时间和油钱都花在了来回跑腿上,灶台真正开火的时间连20%都不到——这就是GPU做推理最大的病根,天生适合批量炒菜的训练场景,面对一个字一个字蹦的串行推理,完全有劲使不出,还得为跑腿付出巨大的功耗和延迟代价。
Groq的LPU,就是把跑腿的问题优化到了极致。它靠超大片上SRAM把仓库搬到了厨房隔壁,用确定性数据流把食材运输路线焊成了专用高铁,再靠静态调度把炒菜时序提前排得明明白白,最终实现了比顶级GPU快几十倍的推理速度,功耗却只有几分之一,难怪英伟达愿意花200亿买单。
但很遗憾,LPU终究没跳出冯・诺依曼架构的框:仓库还是仓库,厨房还是厨房,计算和存储还是分开的,只是跑腿的路变短了而已。面对十几B、几十B的大模型,片上SRAM容量终究有限,大部分参数还是要放外部DRAM里,该跑的长途一趟没少,存储墙这堵墙,终究还是没砸开。包括三星的3D DRAM、HBM-PIM,本质也只是在仓库门口加了个小切配台,始终没解决“在仓库里直接炒菜”的核心问题。
2. 颠覆性的三维存算一体(3D-CIM™️)架构,一家中国公司给出的答案
面对这个死局,杭州微纳核芯给出了不一样的答案:三维存算一体3D-CIM™️。
如果说LPU是把仓库搬到了厨房隔壁,那3D-CIM™️就是直接把灶台建在了仓库的每一层货架旁,伸手拿到食材转身就能炒,彻底把“数据搬运”这个动作从根上抹掉了。技术层面,它不是简单把存储和计算芯片摞在一起,而是通过三维键合技术,把SRAM存算一体计算内核和DRAM存储单元做了垂直堆叠融合,真正在存储器里完成AI计算,还能靠超大容量DRAM装下大模型的海量参数。
很多人问,这么厉害的技术,为什么英伟达、三星不抢着做?因为它要过三道地狱级的坎:架构设计要把计算和存储从根上揉在一起,没有任何成熟经验可参考;三维键合是半导体顶尖工艺,纳米级对准稍有不慎,一次流片就烧掉几千万;非冯・诺依曼架构的生态适配,更是难住了全球无数厂商。
也正因如此,3D-CIM™️长期停留在实验室概念里,而微纳核芯的团队,早在2018年就一头扎进了这条无人区。那时候ChatGPT还没影,大模型还没火,全行业都在盯着GPU和先进制程,没人觉得存算一体能成。这支从北大信息技术高等研究院走出来的团队,一扎就是7年,连续6年在芯片设计“奥林匹克”ISSCC上发表十余项破世界纪录的成果,还拿下了中国企业首个ISSCC最佳技术论文奖,2023年正式落地了全球首创的3D-CIM™️架构。。
3. 三维存算一体(3D-CIM™️)的核心是什么?为什么能成为大模型AI推理的终极方案?
全球巨头都没走通的路,微纳核芯凭什么做成了?答案很简单:他们不是单点技术突破,而是把从架构到落地的全链条彻底走通了,靠三根核心支柱,破解了行业的不可能三角。
第一根支柱,是SRAM存算一体核心架构,从根上破解了算力密度与能效瓶颈。直接在存储单元里完成计算,抹掉了数据搬运的功耗开销,不用依赖3nm、2nm先进制程,在成熟工艺上就能实现远超传统架构的能效比,同等算力下芯片面积只有GPU的1/2到1/3,用更便宜的工艺做出了更好的效果。
第二根支柱,是三维键合技术,彻底打通了大模型推理的带宽与容量任督二脉。大模型推理生成阶段,最大的瓶颈从来不是算力,而是带宽。三维堆叠让单芯片能承载数十GB参数,内核和DRAM的互连带宽提升数十倍,完美破解了带宽卡脖子问题,让大模型端侧本地流畅运行从理论变成了现实。
第三根支柱,是基于RISC-V的RV-CIM™异构融合架构,兼顾了AI计算完备性与全栈生态易用性。行业里绝大多数存算一体芯片,都要开发者重新学一套工具链,而微纳核芯自研的全栈软件工具链,能自动完成主流大模型到芯片指令的映射,开发者不用学任何新东西就能零门槛调用算力,彻底摆脱了对CUDA闭源生态的依赖。也正因这套体系,他们被工信部任命为RISC-V存算一体应用组组长单位,牵头制定全球首个RV-CIM™行业标准。
7年深耕,他们打通了从指令集到算法适配的全链条,布局了120余项核心专利,推出的两款核心芯片,不到4W功耗就能让7B大模型跑出150tokens/s的速度,不到2W功耗就能流畅运行3B大模型,完美解决了端侧AI的核心痛点,也拿下了国内头部存储厂商、终端龙头的深度合作,获得了红杉中国、小米、联想等顶级机构的投资认可。
结尾:换一条赛道,才能跑在前面
AI大模型的爆发,把全球半导体行业推到了全新的十字路口。摩尔定律逼近物理极限,靠制程堆算力的老路已经走不通,下一代AI芯片的竞争,核心早已变成了架构创新。
英伟达花200亿收购Groq,恰恰证明了传统GPU架构撑不起AI推理的未来,而微纳核芯的3D-CIM™️,比LPU走得更远、更彻底,是更接近终局的解决方案。
过去几十年,我们一直在海外巨头的体系里跟跑,而在存算一体这条新赛道上,中国企业已经跑在了前面。3D-CIM™️这条路才刚刚开始,但可以确定的是,端侧AI的普惠时代,一定会因为这项技术提前到来,而在这场后摩尔时代的算力革命里,一定会有中国公司,站在全球舞台的最中央。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
495.8万基站背后:中国数字基建如何从“有”到“优”?
作为新型数字基建核心抓手,全国“信号升格”行动持续纵深推进,并取得丰硕成果。4月21日,在国务院新闻办公室举行的新闻发布会上,工信部副部长张云明介绍了2026年一季度我国工业和信息化的..[详细]
28年后愿望已成的蓝牙,战略布局四大发展方向
1998年5月,爱立信、IBM、英特尔、诺基亚以及东芝达成一个共同愿景,成立如今的蓝牙技术联盟,以便能够在全球实施一个互联互通、低成本的无线技术愿景。当时他们的想法是,如果想建立一个全..[详细]
6G现场亮“绝活” 解锁未来新惊喜!
人形机器人“守门员”精准扑球、全息投影实时直播互动、人形机器人与机器狗精彩“热舞”……如果你还觉得6G是遥远的未来概念,走进 2026 全球 6G 技术与产业生态大会打造的沉浸式 6G “黑科..[详细]
华为ICT大赛十年:让每一颗ICT“种子”都能长成参天大树
当前全球围绕AI、云计算、5G、大数据等科技的竞争不断加剧,而科技竞争的根本是人才的竞争,因此中国一直提倡产学研用紧密结合,通过学科知识竞赛、企业出题高校揭榜等方式培养ICT创新型、实..[详细]
预算缩减与 AI 期许, CIO 如何在不确定性高点下应对
“砍预算了。”这可能是近年来,经常听到的一话。Gartner的数据也印证了这点,自2014年开始,中国企业的IT预算占比基本维持在10%左右,但在2018年开始逐步下跌,2025年甚至达到最低点-0.8%,..[详细]
从构想走向现实,6G迈入产业实战新阶段
作为下一代移动通信核心技术,6G正从概念走向现实,其技术突破、产业布局与全球竞争格局牵动业界神经,成为数字经济领域最受关注的赛道。当前,6G正处于从理论与技术研究向面向产业的技术创..[详细]
AI与网络的深度融合,筑牢智能时代发展底座
近日,以“AI 融智,网联万物:共筑智能新纪元”为主题的“2026年·云网智联大会”在北京召开,众多行业专家及企业代表围绕算力基础设施、自智网络、智能IP广域网、智算中心网络、算网安全、..[详细]
人形机器人马拉松,跑出产业新速度!
4月19日,北京亦庄上演了一场特殊的马拉松比赛,一边是人类跑者奋力奔跑,另一边是人形机器人同步疾驰。当机器人稳稳冲过终点线,亦如撞开了科技与现实的边界,宣告人形机器人终于告别实验室..[详细]
6G渐行渐近 全链协同迈向商用
随着 “十五五”规划纲要正式发布,6G 被明确纳入国家未来产业核心赛道,其战略定位完成从前瞻布局到产业培育的关键升级。这标志着 6G 不再是 5G 的简单技术延续,而是以通信、感知、算力、A..[详细]













