大厂多模态Agent能力激战正酣
12月18日,火山引擎在FORCE原动力大会上正式发布豆包大模型1.8(Doubao-Seed-1.8)及音视频创作模型Seedance 1.5 pro。火山引擎总裁谭待表示,截至今年12月份,豆包大模型日均token使用量突破50万亿,较去年同期增长超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。
“目前大厂在多模态Agent(智能体)领域的竞争已从单点模型能力比拼,升级为‘模型—平台—生态’的系统化作战。”中国移动(101.900, -0.41, -0.40%)通信联合会教育与科学技术研究院执行院长陈晓华在接受《证券日报》记者采访时表示,火山引擎此次发布的产品旨在依托其日均调用量的规模优势,在Agent生态底座上确立领先地位。
技术突围
本次发布的豆包大模型1.8,其核心升级完全围绕“打造更强大的Agent大脑”展开。与单纯追求参数规模不同,该版本在设计之初便针对多模态Agent场景进行定向优化,在复杂指令遵循、多轮交互以及操作系统级别的实际操作(OS Agent)能力上实现了系统性增强。
在至关重要的多模态理解层面,豆包1.8完成了视觉能力的底层升级。其单次视频理解帧数提升至1280帧,并能以低帧率解析超长视频,在需要时调用工具对关键片段进行高精度分析。这一能力使得模型能够处理在线教育课程、工业质检视频等复杂冗长的视觉信息,为Agent在真实场景中自主决策提供了感知基础。
同步亮相的音视频创作模型Seedance 1.5 Pro,则从内容创作端展示了多模态融合的更高阶形态。该模型采用创新的原生音视频联合生成架构,实现了毫秒级的音画同步,并能基于画面景深和角色数量,精准匹配多人、多语言对话的口型。这解决了AI视频生成中长期存在的“张口无声”或口型错位的顽疾,将技术从“炫技”推向“实用”。
火山引擎推出上述两个模型,标志着大模型行业已从单纯的参数竞赛,全面进入了以多模态Agent为核心的产业落地新阶段。赛智产业研究院人工智能研究所副所长安赟对《证券日报》记者表示,这可以从三个维度来分析。其一,AI价值从“单点生成”向“全链路执行”的质变。通过多模态感知与Agent规划能力的结合,AI能够跨越感知与行动的鸿沟,真正具备了在垂直场景中闭环完成任务的能力。其二,IT基础设施从“功能驱动”向“智能驱动”的范式重构。火山引擎提出的“AI云原生架构”极具前瞻性,揭示了未来的软件形态将不再是传统的SaaS堆栈,而是以Agent为主体的智能协同网络。其三,大模型应用正在跨越“成本与稳定性”的规模化门槛。
竞争加剧
事实上,主要云厂商均已将战略重心调整至多模态智能体平台,竞争维度从单一模型能力升级为全栈技术、开发生态与行业场景的立体化角逐。
阿里云在9月份的云栖大会上全面升级了其全栈AI体系,实现从AI大模型到AI基础设施的技术更新。阿里通义旗舰模型Qwen3-Max不仅在多项评测中跻身全球前列,更在聚焦Agent工具调用能力的Tau2-Bench测试中取得突破性高分。更重要的是,阿里云发布了全新的Agent开发框架ModelStudio-ADK和低代码平台ModelStudio-ADP,将Agent的开发效率提升至“1个小时就能轻松开发一个能生成深度报告的Deep Research项目”的水平。
10月15日,百度搜索宣布全面升级文心助手AIGC创作能力,支持AI图片、AI视频、AI音乐、AI播客等8种模态创作。依靠百度搜索开放平台,文心助手支持一键调用多工具解决生活、健康、教育、工作等多场景问题。
在谭待看来,传统的IT架构已无法满足Agent时代的需求,以模型为中心的AI云原生架构正在形成,并围绕Agent的开发与运营进行重构。
面对竞争,火山引擎此次打出了“组合拳”。火山引擎全面升级了企业级AI Agent平台——AgentKit,覆盖了Agent从开发、部署到管控的全生命周期。同时,火山引擎推出了HiAgent智能体工作站,通过构建统一的企业AI任务调度中心、提供一系列开箱即用的通用智能体,以及支持个性化定制智能体应用,帮助企业实现Agent的规模化管理与应用。
除了提升模型能力外,火山引擎还推出业内首个“AI节省计划”,该计划通过阶梯定价,承诺最高可为按量付费的企业节省47%的成本。
“通过从模型能力到基础设施的全面革新,火山引擎正在推动AI应用从单一的模型调用向复杂的Agent智能体生态演进,加速AI在各行各业的深度落地。”谭待表示。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
彩云之南,向新而行:解锁数智云南新场景、新活力
)“十四五”期间,云南持续加大数字化基础设施投入,积极推动行业数智化、低碳化转型,取得了丰硕成果。[详细]
折痕有望消灭,但折叠屏手机又添新课题?
近期,关于折叠屏手机的消息一波接一波,先是三星的三折叠机型现身,后是流出关于苹果阔折叠机型的消息,不过关于折叠屏手机的技术难题,似乎还是存在。[详细]
从规模破局到质效突围:5G工厂迈入量质齐升新赛道
2025年作为“十四五”时期5G工厂“百千万”行动收官之年,我国5G工厂建设已从起步探索迈入规模应用新阶段,1260个5G工厂纳入官方名录,累计带动投资591.3亿元,覆盖41个工业大类、近90个行业..[详细]
信息光子技术产业正加速发展,并进入重要战略机遇期
当前,信息光子技术产业正加速发展,并进入重要战略机遇期。近日,中国信通院发的《信息光子技术发展与应用研究报告(2025 年)》(以下简称《报告》)指出,一方面,需求侧与人工智能、先进计..[详细]
中国信通院正式发布2026深度观察十大趋势
12月13日,2026中国信通院深度观察报告会主报告会在北京举办。本次报告会主题为 “面向“十五五”,人工智能浪潮下的新质生产力发展”。工业和信息化部党组成员、副部长张云明出席报告会并致..[详细]













