首页|必读|视频|专访|运营|制造|监管|芯片|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|大数据|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

豆包·同声传译模型2.0来了:3s延迟,实时声音复刻

2025年7月24日 17:11  CCTIME飞象网  

7月24日,火山引擎正式发布豆包·同声传译模型 Seed LiveInterpret 2.0,现已全量上线火山方舟平台。只需开口说话,你的“同款”声音就能同时开口说外语;演讲过程中,双语字幕与你的声音同步生成。

豆包·同声传译模型2.0是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界 SOTA 的同时,实现了极低的语音延迟水平和“0样本声音复刻”。这意味着,国际会议、跨境谈判等场景的实时交互体验将得以大幅提升,跨语言交流再也不怕生硬!

豆包·同声传译模型2.0像一位思维超敏捷的“同传专家”,基于端到端理解和生成框架,面向中英文,可实时接收多人语音输入,并在“听”的过程中同步理解、复刻声音,并输出语音和译文,以极低延迟实现高质量语音翻译,真正实现了“边听边说”。相比传统机器同传系统,豆包·同声传译模型2.0具备以下优势:

极低的语音延迟,沟通无断点:采用全双工语音理解生成框架,翻译延迟可低至2-3秒,较传统机器同传系统降低超60%,实现了真正的“边听边说”翻译。

0样本声音复刻,音色无缝跨越:无需提前录制,一边说话一边采样,即可实现“0样本”声音复刻,让同一个人同音色开口说外语,给现场的听众更还原更沉浸的体验。

智能平衡节奏,对话超自然:可根据语音清晰度、流畅度、复杂程度,调整输出节奏,并适配不同语言特性。面对超长信息,依然能保证传译语音节奏的自然流畅。

近期,豆包·同声传译模型已在多个权威国际会议中应用。在2025中关村论坛年会上,为多场重量级会议提供顶流 AI 同传服务,助力中外学者无缝畅聊,获央视点赞!在2025全球数字经济大会上,同样实现了外籍嘉宾发言的同步音色复刻翻译,参会者无需戴耳机,看屏幕字幕就能轻松 get 内容,实现“低延迟、高准确、听得懂”。

除了大型国际会议,豆包·同声传译模型还可以在更多生活场景发挥价值。例如,TikTok 主播用母语直播时,实时将内容翻译成外语并复刻主播声音,让外国观众听懂并信任,加速生意达成;在出境旅游方面将作为“随行翻译”,通过豆包实时翻译导游所讲内容,让语音沟通不再阻碍探索世界的脚步;帮助记者快速准确获取外文资讯与采访内容,辅助写稿,提升新闻时效性与准确性。

目前,豆包·同声传译模型 Seed LiveInterpret 2.0已在火山方舟开放使用,并即将在8月上线 Ola Friend 耳机,为用户带来更加灵活的使用方式和体验。

更多详细信息和功能将在7月30日的火山引擎 FORCE Link AI 创新巡展·厦门站公布,敬请期待!

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐新闻              
 
人物
中国移动董事长杨杰:聚“AI+”时代合力 共启数字经济新篇章
精彩视频
中国联通郝立谦:凭借三大核心优势,携手各界伙伴共赴智能新时代新征程
中兴通讯徐子阳:夯实基础能力,构建数字转型共同体
中国商飞贺东风:人工智能技术加速迭代,正迎来爆发式发展
华为杨超斌:AI应用已成为整个ICT技术基础设施建设的核心动力
精彩专题
2025中国联通合作伙伴大会
2025 MWC 上海
2025工业互联网大会
2025世界电信和信息社会日大会
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像