微软发布新一代高性能 AI 推理芯片
微软(470.28,4.33,0.93%)正式发布新款芯片Maia 200,该公司称这款芯片是为 AI 推理规模化部署打造的高性能核心算力芯片。
作为 2023 年推出的Maia 100的升级款,微软表示,Maia 200 在技术上实现了升级,能够以更快的速度、更高的能效运行高性能 AI 模型。这款芯片集成超 1000 亿个晶体管,4 比特精度下的算力可达 10 petaflops 以上,8 比特精度算力约 5 petaflops,相较上一代产品实现大幅提升。
AI 推理指运行已训练完成模型的计算过程,与模型训练所需的计算过程不同。随着人工智能企业的发展走向成熟,推理成本在企业整体运营成本中的占比持续提升,也让行业重新聚焦于推理流程的优化方案。
微软希望 Maia 200 能成为推动这一优化的关键产品,助力 AI 企业实现更稳定的业务运行与更低的能耗。微软表示:“实际应用中,单节点 Maia 200 可轻松运行当前规模最大的 AI 模型,且为未来更大规模的模型运算预留了充足的算力空间。”
当前科技巨头纷纷自研芯片,以此降低对英伟达的依赖 —— 英伟达的前沿图形处理器(GPU)已成为人工智能企业发展的核心算力支撑,微软这款新芯片的推出,正是这一趋势的体现。例如,谷歌(333.59,5.16,1.57%)推出了张量处理单元(TPU),该产品并非以芯片形式对外销售,而是通过谷歌云平台以算力服务的形式开放;电商巨头亚马逊(238.42,-0.74,-0.31%)则拥有自研 AI 加速芯片 Trainium,其最新款 Trainium3 已于去年 12 月发布。这些自研芯片均可承接原本由英伟达 GPU 承担的部分计算任务,从而降低企业的整体硬件成本。
这款芯片采用台积电(332.71,-2.16,-0.65%)3 纳米制程工艺,每台服务器内集成四颗芯片,通过以太网电缆实现连接,而非 InfiniBand 高速互联标准。英伟达在 2020 年收购迈络思后,便开始推出 InfiniBand 交换机产品。
格斯里在博客中写道,同等价格下,Maia 200 的性能较同类产品高出 30%。微软表示,单颗 Maia 200 搭载的高带宽内存,容量超过亚马逊云科技第三代 Trainium AI 芯片和谷歌第七代张量处理单元。
格斯里还指出,微软可将多达 6144 颗 Maia 200 芯片组网联动,在实现高性能算力的同时,降低能耗与整体拥有成本。
微软透露,Maia 系列芯片已投入实际应用,为该公司超智能团队的各类 AI 模型提供算力支持,同时也为旗下聊天机器人 Copilot 的日常运营提供技术支撑。截至 1 月 26 日,微软已邀请开发者、科研学者以及前沿人工智能实验室等多方主体,在其业务算力负载中试用 Maia 200 软件开发工具包(SDK)。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
盘点2025|光纤光缆:周期性放缓之下,确定性开始凸显
在2025年,光纤光缆厂商们习惯于用“周期性”一词来描述当前的困难,相比于宽带普及、4G升级换代带来的流量需求猛增这一巨大业务增长。可如今在刷着短视频、看着带货的新日常生活常态下,尽..[详细]
盘点2025|人工智能:破局前行、以智启新,同赴人机共生新未来
2025年,人工智能行业迎来技术迭代与价值落地的双重关口。这一年里既延续着近年来的高速增长态势,也迎来从野蛮生长向规范提质的深刻转型。 [详细]
盘点2025|算力行业:量质齐升的进阶之路
在数字经济加速渗透全球经济社会各领域的今天,算力已成为继电力、水资源之后的关键生产要素,是支撑数字中国建设、推动高质量发展的核心基础设施。算力的规模与质量直接决定了数字经济的发..[详细]
盘点2025|芯片:AI依旧是挖潜点,应用进一步多样化
时至2025年年底,人们已经开始渐渐习惯,有事听听AI给出的参考意见。其背后的算力支撑也在逐步加强,像是更先进的制程,以及向更多端侧设备的拓展。另一方面,AI又一石激起千层浪,机遇与需..[详细]
盘点2025 | 从5G到6G:深耕与突破并行,开启智能连接新纪元
2025年,全球通信产业站在了一个关键的历史交汇点。这一年既是“十四五”规划的收官年,5G建设成果全面转化的验收年,也是“十五五”规划启幕,6G布局从技术探索迈向工程落地的奠基之年,更..[详细]
盘点2025|量子信息:三大领域技术持续演进,产业发展未来可期
以量子计算、量子通信和量子精密测量为代表的量子信息技术是挑战人类调控微观世界能力极限的世纪系统工程,是对传统技术体系产生冲击、进行重构的重大颠覆性创新,将引领新一轮科技革命和产..[详细]
盘点2025|2025年智能终端趋势洞察:AI重构体验,超级终端时代加速到来
2025年,全球智能终端行业站在了技术革新与生态重构的十字路口。AI技术的规模化渗透、折叠屏形态的成熟落地、跨设备协同的深度演进,正在重塑终端产品的价值逻辑与市场格局。[详细]
82:1 的身份数量比挑战,AI普及下的网络安全风险格局
刚刚过去的2025年,很多人的日常工作开始习惯于偷点懒,让AI给出更多参考,以节省几十分钟的思考或检索时间。在近期派拓网络给出2026 年 AI 与网络安全六大预测中,给出了82:1这样一个数字,..[详细]
人形机器人市场爆发:中国厂商领跑,四大场景落地提速
国际数据公司(IDC)近日发布的《全球人形机器人市场分析》报告显示,2025年全球人形机器人出货量约1.8万台,同比增长约508%。中国厂商在规模化商用进程中表现强劲,全球人形机器人市场销量..[详细]
6G 技术演进关键一跃:从理论研究走向系统验证
2025年,5G演进技术5G-A在中国实现了规模商用,全球通信行业开始越来越多地把注意力聚焦在下一代移动通信技术6G上。作为最早实现5G和5G-A规模商用的电信运营商之一,中国移动不仅拥有全球规..[详细]













