首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

豆包语音大模型首家引领级通过中国信通院语音大模型评估

2025年1月20日 11:49  CCTIME飞象网  

近日,火山引擎提供的豆包大语音模型成为首家“引领级”通过中国信通院语音大模型能力评估的产品,经相关标准和评估测试显示,豆包大语音模型在语音合成、复刻、识别分析等方面能力突出,处于行业领先地位。

近年来,随着人工智能技术的快速发展,语音大模型作为语音理解和生成的关键技术,正不断赋能各行业的智能化转型。在此背景下,中国信通院制定了《语音大模型技术能力要求》标准旨在为行业提供技术参考和规范,提升语音大模型技术能力的可操作性和标准化水平。据介绍,标准共包含两大评估板块的4个方面

能听:

○ 精准的语音识别能力(ASR):具备高准确率,能够精准识别不同场景语音输入,包括噪声环境中的语音、方言和口音。

○ 多语种与跨语言处理:支持多语种语音识别,适配全球化应用场景。

○ 感知语境变化:能区分语气、情感变化,捕捉说话者意图和语义。

会说:

○ 自然语音合成(TTS),实现接近真人语音的合成,支持情感化表达和多种语言发声。

○ 多样化语音风格:支持多种音色、语速和语调的自定义输出,满足个性化需求。

○ 实时生成能力:毫秒级响应时间,支持实时语音交互。

够懂:

○ 深度语义理解:能准确理解语音输入中的复杂语义、上下文关联和用户意图。

○ 多任务协同处理:能同时完成语音识别、情感分析、语言翻译等多任务。

○ 个性化适配:根据用户历史数据调整语音交互方式,实现个性化推荐或对话内容定制。

好用:

○ 广泛的应用场景支持:从个人助手到行业解决方案,覆盖家居、医疗、教育、金融等领域。

○ 轻量化与边缘部署:优化模型适配终端设备,在低算力环境中实现高性能。

○ 高效开发与标准化接口:支持快速集成和跨平台应用,降低开发与部署成本。

据了解在本次评估中,豆包语音大模型全部满足23项功能评估、在4项性能评估得分表现优秀,支持20余项服务能力,成为国内首家引领级通过评估的产品,具备优异的语音合成、复刻、识别、分析等能力。

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
中国信通院汤立波:“5G+工业互联网”已进入规模化发展新阶段
精彩专题
2024通信业年终盘点
2024数字科技生态大会
2024年度中国光电缆优质供应商评选活动
2024全球6G发展大会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像