首页|必读|视频|专访|运营|制造|监管|芯片|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|大数据|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

2025H1大模型公有云中国第一!火山引擎市场份额近半

2025年9月19日 17:30  CCTIME飞象网  

9月17日,国际数据公司(IDC)公布的《中国大模型公有云服务市场分析,2025H1》报告指出,2025年上半年,中国公有云上大模型调用量达536.7万亿Tokens。其中,火山引擎以49.2%的市场份额位居中国市场第一,阿里云、百度智能云分别占比27%、17%,位列第二、第三位。

(统计口径:各大云厂商对外部客户提供的大模型公有云服务调用量,不包含自有业务调用。如火山引擎统计,不包括抖音APP、豆包APP、即梦APP等字节跳动一方产品调用量。)

今年,随着推理模型、多模态模型能力的进一步提升,模型调用的商业模式逐渐成熟。IDC指出,相比2024全年114万亿Tokens的市场规模,仅2025年上半年就实现了近400%的增长。市场增长的驱动力一方面来源于原有的泛互联网、企业级的应用场景的扩展以及客户群体下沉,另一方面来源于不断丰富的模型体系。

市场持续快速增长的同时,2025年上半年,火山引擎凭借49.2%的份额依然稳居市场第一,且份额占比有所提高。此前,IDC公布2024年大模型公有云调用量,火山引擎以46.4%的市场份额位居中国市场第一。

中国公有云大模型调用量月度环比增长,2025H1中国大模型公有云服务市场按照Tokens计算的调用量达5367270亿次。

IDC预测,未来中国生成式AI软件将持续高速增长,在基础模型持续创新、模型开发应用工具链不断完善以及智能体的爆发下,该市场规模2028年将达到482.4亿元人民币,未来仍将有数百倍增长空间。

Agent应用爆发前,火山引擎多模态和深度推理大模型需求高涨

IDC报告指出,AI应用将是未来驱动模型调用的最核心因素,尤其是智能体的爆发。其中,多模态和深度推理大模型成为最主要的迁移力。

在多模态模型的需求上,近75%的组织已经评估了采用多模态基础模型和单模态基础模型的应用程序,预计多模态模型将提供更丰富、更细致入微的功能。 使用多模态基础模型构建的应用程序可以处理和整合多种类型的数据,这些数据更丰富、更能感知上下文,从而大大提高准确性、效率和用户体验。

这也是各大云厂商在今年发力的重点:火山引擎、阿里云、腾讯云等大模型云厂商在语音、图像、视频等多模态领域迅速迭代。其中,火山引擎豆包大模型家族自2024年推出以来,多模态模型效果持续领先。

今年,火山引擎相继推出豆包大模型1.6、豆包·视频生成模型Seedance pro、豆包·实时语音模型、豆包·图像创作模型Seedream 4.0等,其中多个大模型登顶Artificial Analysis、LMArena竞技场。这些多模态大模型有效加速了AI应用落地。

Seedream 4.0位居Artificial Analysis 文生图榜单第一

Seedream 4.0位居Artificial Analysis 图像编辑榜单第一

*截至 2025年9月

Seedream 4.0位居LMArena文生图榜单第一

Seedream 4.0位居LMArena图像编辑榜单第二

*截至 2025年9月

同时,今年2月DeepSeek-R1,加速了国内市场,从模型训练向推理服务迁移。

随着市场迅速向推理服务迁移,推理Tokens量级变大,企业也越来越重视资源效率、管理运营成本和可持续发展。

IDC指出,火山引擎为用户提供了丰富的大模型以及完善的工具链,通过更优性能的推理服务,其MaaS平台火山方舟2025H1按照Tokens计算的调用量实现了398.2%倍增长,增长的驱动力一方面来源于客群的扩展,另一方面来源于Agent应用。

面向Agent应用,火山引擎提供了极致服务,能做到模型的API在吞吐、并发、首字延迟、平均延迟、成本优化、资源保障、安全可信这些客户可感知指标上,均为行业领先。同时,火山引擎还提供了先进技术,在算子层(算法优化)、系统层(PD分离)对模型进行了深度优化,包括:PD分离架构、KV-Cache缓存加速、自研推理加速引擎 xLLM、自研 vRDMA 网络等。

除了模型本身,IDC认为,Agent广泛渗透需要全栈技术的重构。AI时代,技术主体正在从Web、APP逐渐变成Agent,这意味着开发范式将发生重大变化。

在承接最多市场需求的推动下,火山引擎率先推出以大模型为核心、以生产级可用的复杂Agent为负载的AI云原生架构,帮助开发者屏蔽底层硬件差异和开发复杂性,直接从云端获得高质量、低成本的 Tokens,加速企业Agent落地和业务创新。

AI+泛互联网深度融合,各行业加速AI渗透

随着模型能力的持续提升、以复杂Agent为核心的AI云原生基础设施进一步完善,新场景正在被不断解锁。此前,火山引擎在今年6月Force大会上透露Tokens消耗快速增长背后,AI工具的Tokens消耗在快速增长,5个月增长了4.4倍。

其中AI搜索增长10倍,AI 编程增长了8.4倍。视觉理解模型则是另一个助推器。比如,K12的在线教育,由于VLM模型能力不断提升,Tokens消耗5个月增长了12倍,而新出现的智能巡检,视频检索等数个场景也快速实现日均百亿tokens的突破。

IDC报告指出,预计大模型服务市场仍有百倍以上空间,用户群体正在从泛互到传统企业渗透。在行业里,大模型的应用不断深化。

在消费电子行业,企业将大模型应用在语音助手,创作工具,效率提升等诸多场景,全球Top10手机厂商有9家和火山引擎深度合作。

在汽车行业,大模型覆盖了从智能座舱,到智能营销,到自动驾驶标注等全流程场景,豆包大模型助力奔驰、宝马、奥迪、特斯拉、蔚来等八成主流汽车AI升级。

在金融行业,火山引擎为客户提供智能展业、投顾、投研等大模型应用方案,已服务华泰证券、国信证券等数十家券商和基金公司,招商银行、浦发、民生等70%的系统重要性银行。

在教育行业,火山引擎面向教学服务、科研辅助、师生服务和管理辅助等场景,提供大模型解决方案,已与北京大学、浙江大学、南开大学等超五成985高校达成合作,持续推动高等教育智能化转型。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐新闻              
 
人物
中国移动董事长杨杰:激发数据要素潜能,共谱“AI+”时代华章
精彩视频
2025年国家网络安全周:筑牢数字安全根基,共绘高质量发展未来
移起向青 智绘高原 青海数智化主题探访活动
记者探馆光博会:寻找隐藏在生活中的“科技之光”
既熟悉又陌生的光博会,光学映射下的科技进化浪潮
精彩专题
第26届中国国际光电博览会
2025中国算力大会
ICT产业2025年中业绩盘点
2025世界人工智能大会暨人工智能全球治理高级别会议
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2025 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像