2025H1大模型公有云中国第一!火山引擎市场份额近半
9月17日,国际数据公司(IDC)公布的《中国大模型公有云服务市场分析,2025H1》报告指出,2025年上半年,中国公有云上大模型调用量达536.7万亿Tokens。其中,火山引擎以49.2%的市场份额位居中国市场第一,阿里云、百度智能云分别占比27%、17%,位列第二、第三位。
(统计口径:各大云厂商对外部客户提供的大模型公有云服务调用量,不包含自有业务调用。如火山引擎统计,不包括抖音APP、豆包APP、即梦APP等字节跳动一方产品调用量。)

今年,随着推理模型、多模态模型能力的进一步提升,模型调用的商业模式逐渐成熟。IDC指出,相比2024全年114万亿Tokens的市场规模,仅2025年上半年就实现了近400%的增长。市场增长的驱动力一方面来源于原有的泛互联网、企业级的应用场景的扩展以及客户群体下沉,另一方面来源于不断丰富的模型体系。
市场持续快速增长的同时,2025年上半年,火山引擎凭借49.2%的份额依然稳居市场第一,且份额占比有所提高。此前,IDC公布2024年大模型公有云调用量,火山引擎以46.4%的市场份额位居中国市场第一。

中国公有云大模型调用量月度环比增长,2025H1中国大模型公有云服务市场按照Tokens计算的调用量达5367270亿次。
IDC预测,未来中国生成式AI软件将持续高速增长,在基础模型持续创新、模型开发应用工具链不断完善以及智能体的爆发下,该市场规模2028年将达到482.4亿元人民币,未来仍将有数百倍增长空间。
Agent应用爆发前,火山引擎多模态和深度推理大模型需求高涨
IDC报告指出,AI应用将是未来驱动模型调用的最核心因素,尤其是智能体的爆发。其中,多模态和深度推理大模型成为最主要的迁移力。
在多模态模型的需求上,近75%的组织已经评估了采用多模态基础模型和单模态基础模型的应用程序,预计多模态模型将提供更丰富、更细致入微的功能。 使用多模态基础模型构建的应用程序可以处理和整合多种类型的数据,这些数据更丰富、更能感知上下文,从而大大提高准确性、效率和用户体验。
这也是各大云厂商在今年发力的重点:火山引擎、阿里云、腾讯云等大模型云厂商在语音、图像、视频等多模态领域迅速迭代。其中,火山引擎豆包大模型家族自2024年推出以来,多模态模型效果持续领先。
今年,火山引擎相继推出豆包大模型1.6、豆包·视频生成模型Seedance pro、豆包·实时语音模型、豆包·图像创作模型Seedream 4.0等,其中多个大模型登顶Artificial Analysis、LMArena竞技场。这些多模态大模型有效加速了AI应用落地。

Seedream 4.0位居Artificial Analysis 文生图榜单第一

Seedream 4.0位居Artificial Analysis 图像编辑榜单第一
*截至 2025年9月

Seedream 4.0位居LMArena文生图榜单第一

Seedream 4.0位居LMArena图像编辑榜单第二
*截至 2025年9月
同时,今年2月DeepSeek-R1,加速了国内市场,从模型训练向推理服务迁移。
随着市场迅速向推理服务迁移,推理Tokens量级变大,企业也越来越重视资源效率、管理运营成本和可持续发展。
IDC指出,火山引擎为用户提供了丰富的大模型以及完善的工具链,通过更优性能的推理服务,其MaaS平台火山方舟2025H1按照Tokens计算的调用量实现了398.2%倍增长,增长的驱动力一方面来源于客群的扩展,另一方面来源于Agent应用。
面向Agent应用,火山引擎提供了极致服务,能做到模型的API在吞吐、并发、首字延迟、平均延迟、成本优化、资源保障、安全可信这些客户可感知指标上,均为行业领先。同时,火山引擎还提供了先进技术,在算子层(算法优化)、系统层(PD分离)对模型进行了深度优化,包括:PD分离架构、KV-Cache缓存加速、自研推理加速引擎 xLLM、自研 vRDMA 网络等。
除了模型本身,IDC认为,Agent广泛渗透需要全栈技术的重构。AI时代,技术主体正在从Web、APP逐渐变成Agent,这意味着开发范式将发生重大变化。
在承接最多市场需求的推动下,火山引擎率先推出以大模型为核心、以生产级可用的复杂Agent为负载的AI云原生架构,帮助开发者屏蔽底层硬件差异和开发复杂性,直接从云端获得高质量、低成本的 Tokens,加速企业Agent落地和业务创新。
AI+泛互联网深度融合,各行业加速AI渗透
随着模型能力的持续提升、以复杂Agent为核心的AI云原生基础设施进一步完善,新场景正在被不断解锁。此前,火山引擎在今年6月Force大会上透露Tokens消耗快速增长背后,AI工具的Tokens消耗在快速增长,5个月增长了4.4倍。
其中AI搜索增长10倍,AI 编程增长了8.4倍。视觉理解模型则是另一个助推器。比如,K12的在线教育,由于VLM模型能力不断提升,Tokens消耗5个月增长了12倍,而新出现的智能巡检,视频检索等数个场景也快速实现日均百亿tokens的突破。
IDC报告指出,预计大模型服务市场仍有百倍以上空间,用户群体正在从泛互到传统企业渗透。在行业里,大模型的应用不断深化。
在消费电子行业,企业将大模型应用在语音助手,创作工具,效率提升等诸多场景,全球Top10手机厂商有9家和火山引擎深度合作。
在汽车行业,大模型覆盖了从智能座舱,到智能营销,到自动驾驶标注等全流程场景,豆包大模型助力奔驰、宝马、奥迪、特斯拉、蔚来等八成主流汽车AI升级。
在金融行业,火山引擎为客户提供智能展业、投顾、投研等大模型应用方案,已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的系统重要性银行。
在教育行业,火山引擎面向教学服务、科研辅助、师生服务和管理辅助等场景,提供大模型解决方案,已与北京大学、浙江大学、南开大学等超五成985高校达成合作,持续推动高等教育智能化转型。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
5G-A赋能机器人火炬接力:中国移动以技术革新点亮全运科技盛宴
2025年11月,第十五届全国运动会将在粤港澳三地盛大启幕。这场赛事不仅是体育健儿的竞技场,更是前沿科技落地应用的“试验田”。其中,11月2日的机器人火炬接力作为本次全运会的核心创新亮点..[详细]
轻薄机型出师未捷身先死,长使业绩泪满襟
当iPhone Air宣布上市当天,随着各路评测内容解禁,一个显眼的标题也随之出现,那就是“注定停产”。轻薄机型的出现一方面让人们看到厂商正在挖掘全新市场空间,另一方面也勾起了小尺寸机型..[详细]
智能未来:宇宙为你闪烁
未来十年,你家的电表可能再也不用换电池,自动驾驶汽车能"看到"几公里外的路况,甚至海洋深处的传感器都能实时传回数据。这些不是科幻,而是刚刚在无锡物博会上发布的《2025全球..[详细]
智能IP广域网成为筑牢智算产业发展根基的关键一环
随着国家加速推动智算产业高质量发展,网络支撑能力已成为产业进阶的核心抓手,而作为关键基础设施的智能IP广域网,正凭借其在算力调度、数据传输中的核心作用,成为筑牢智算产业发展根基的..[详细]
大中华区市场失守 苹果寄望AI驱动未来增长
苹果公司公布的2025 财年第四季度财报呈现“冰火两重天”态势:全球营收1024.66亿美元同比增长 8%,净利润274.66亿美元同比激增86.4%,毛利率攀升至 47.18%。但作为第三大市场的大中华区却成..[详细]













