近日,国际数据公司(IDC)发布的《中国视频云市场跟踪(2024下半年)》报告显示,2024下半年中国视频云市场规模达到50.8亿美元,同比增长4.7%。火山引擎凭借在视频内容分发网络服务、直播云服务及音视频通信云服务等领域的持续突破,进一步巩固了市场竞争优势。
此次报告中,IDC还首次增设了AI视频云Add-on跟踪研究。火山引擎视频云依托豆包大模型,凭借在AI领域的积极探索与广泛实践,成为同时入选“AI实时互动”与“智能媒体生产”两大细分项类的厂商,尤其在“智能媒体生产”领域,更是位列行业第一。这一成绩彰显了火山引擎在"AI+视频云"融合创新赛道的技术实力。
如今,我们正从高清流畅的数字视频时代迈向更智能、更交互、更沉浸的AI视频时代。随着视频云技术迭代和多模态大模型突破,"音视频+AI"正打破场景壁垒,重塑沟通方式、重构内容生产流程,为用户带来全新体验。
作为技术革新引领者,火山引擎视频云将豆包大模型和AI能力深度融入音视频全链路,实现了从生产端、交互端到消费端的全面智能化升级,推动行业进入“智造- 智联-智享”的新阶段。
在生产端,火山引擎视频云融合豆包大模型 AIGC、ASR 等技术,实现多模态内容的高质、高效生产。其多模态视频理解与生成方案可自动提取视频高光并生成解说内容,让字幕识别错误率降低了30%,90集短剧的营销视频素材生产效率提升20倍。目前,该方案已覆盖赛事、直播电商、教育和节目制作等场景。
为了让内容生成更加丰富有趣,火山引擎还为电商打造了多模态素材生成方案,支持自动生成商品氛围图、图文解说视频及3D模型等多元营销素材,实现高效多模态内容创作。生产端的升级,并不止于视频画面,声影同传方案融合精准字幕、声音复刻和虚拟口型技术,大幅优化观众视听体验。
在交互端,火山引擎通过 RTC 技术与TTS语音合成的融合,提升人与AI交互的真实感与流畅度。该方案已经广泛落地于智能助手、AI陪伴、AI教育、智能客服等场景。比如,在儿童陪伴场景,针对孩子们语速慢、表达不连贯等特点,火山引擎优化了实时打断速度和断句识别准确度,创造一个更加友好和鼓励性的交流环境。在AI社交陪伴场景,通过智能匹配输出内容与方式,结合语音与文字构建对话场景及情感背景,让交互体验更自然真实。
在消费端,火山引擎持续推动虚实融合的沉浸式体验落地。依托 Beaver 3D生成模型,用户1分钟就可以生成高保真3D资产;通过大场景3D重建方案,实现了对真实场景的高质量几何构建与外观重建渲染,广泛应用于虚拟直播、VR直播等场景中。此外,借助 6DOF 直播技术,观众还可360度自由视角观看直播内容。
当前,行业客户正积极抓住AI带来的增长机遇,推动视频云市场进入新一轮的增长周期。火山引擎凭借其在“AI+视频云”领域的领先地位和持续创新,将继续引领行业的发展,为用户提供更加智能、高效、沉浸式的音视频体验。