每日微信报
人物专访监管
制造芯片
6G 运营
大数据物联网
移动互联网量子
云计算互联网
报告卫星

火山引擎领跑"AI+视频云"新赛道，斩获“智能媒体生产”第一

2025年5月21日 11:06CCTIME飞象网

近日，国际数据公司（IDC）发布的《中国视频云市场跟踪（2024下半年）》报告显示，2024下半年中国视频云市场规模达到50.8亿美元，同比增长4.7%。火山引擎凭借在视频内容分发网络服务、直播云服务及音视频通信云服务等领域的持续突破，进一步巩固了市场竞争优势。

此次报告中，IDC还首次增设了AI视频云Add-on跟踪研究。火山引擎视频云依托豆包大模型，凭借在AI领域的积极探索与广泛实践，成为同时入选“AI实时互动”与“智能媒体生产”两大细分项类的厂商，尤其在“智能媒体生产”领域，更是位列行业第一。这一成绩彰显了火山引擎在"AI+视频云"融合创新赛道的技术实力。

如今，我们正从高清流畅的数字视频时代迈向更智能、更交互、更沉浸的AI视频时代。随着视频云技术迭代和多模态大模型突破，"音视频+AI"正打破场景壁垒，重塑沟通方式、重构内容生产流程，为用户带来全新体验。

作为技术革新引领者，火山引擎视频云将豆包大模型和AI能力深度融入音视频全链路，实现了从生产端、交互端到消费端的全面智能化升级，推动行业进入“智造- 智联-智享”的新阶段。

在生产端，火山引擎视频云融合豆包大模型 AIGC、ASR 等技术，实现多模态内容的高质、高效生产。其多模态视频理解与生成方案可自动提取视频高光并生成解说内容，让字幕识别错误率降低了30%，90集短剧的营销视频素材生产效率提升20倍。目前，该方案已覆盖赛事、直播电商、教育和节目制作等场景。

为了让内容生成更加丰富有趣，火山引擎还为电商打造了多模态素材生成方案，支持自动生成商品氛围图、图文解说视频及3D模型等多元营销素材，实现高效多模态内容创作。生产端的升级，并不止于视频画面，声影同传方案融合精准字幕、声音复刻和虚拟口型技术，大幅优化观众视听体验。

在交互端，火山引擎通过 RTC 技术与TTS语音合成的融合，提升人与AI交互的真实感与流畅度。该方案已经广泛落地于智能助手、AI陪伴、AI教育、智能客服等场景。比如，在儿童陪伴场景，针对孩子们语速慢、表达不连贯等特点，火山引擎优化了实时打断速度和断句识别准确度，创造一个更加友好和鼓励性的交流环境。在AI社交陪伴场景，通过智能匹配输出内容与方式，结合语音与文字构建对话场景及情感背景，让交互体验更自然真实。

在消费端，火山引擎持续推动虚实融合的沉浸式体验落地。依托 Beaver 3D生成模型，用户1分钟就可以生成高保真3D资产；通过大场景3D重建方案，实现了对真实场景的高质量几何构建与外观重建渲染，广泛应用于虚拟直播、VR直播等场景中。此外，借助 6DOF 直播技术，观众还可360度自由视角观看直播内容。

当前，行业客户正积极抓住AI带来的增长机遇，推动视频云市场进入新一轮的增长周期。火山引擎凭借其在“AI+视频云”领域的领先地位和持续创新，将继续引领行业的发展，为用户提供更加智能、高效、沉浸式的音视频体验。

编辑：T01

飞象网版权及免责声明:
1.本网刊载内容，凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有，未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载，请必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和飞象网来源。
2.凡注明“来源：XXXX”的作品，均转载自其它媒体，在于传播更多行业信息，并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题，请在相关作品刊发之日起30日内与本网联系，我们将第一时间予以处理。
本站联系电话为86-010-87765777，邮件后缀为cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。