首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片|报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

语音识别上难度 讯飞输入法免切换识别多语种多方言不迷糊!

2024年7月2日 09:42  CCTIME飞象网  

近日,科大讯飞在北京发布讯飞星火大模型V4.0及相关落地应用。讯飞星火V4.0七大核心能力全面提升,整体超越GPT-4 Turbo,在8个国际主流测试集中排名第一,国内大模型全面领先。同时,本次星火语音大模型再升级,发布国际领先的多语种多方言免切换语音识别能力。讯飞输入法现场演示了方言外语免切换语音输入,大大提升用户的输入效率。

刘庆峰认为,语音将成为万物互联时代人机交互的主要方式,人机交互最重要的场景是远场、噪声、多人说话、多语言,因此万物互联时代的AIUI(人工智能用户界面)要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准,并于2023年5月发布。

在讯飞星火4.0发布之际,星火语音大模型升级发布国际领先的多语种多方言免切换语音识别能力,可支持37个语种、37种方言“自由对话”。其中,37个语种识别效果领先OpenAI whisper-V3,37个方言识别效果平均提升30%。发布会现场,工作人员演示了讯飞输入法免切换识别模式下多种方言和多种外语的语音输入,让输入效率大大提高。

作为中文语音输入的开创者,讯飞输入法通过语音的持续迭代,不断革新人机交互方式,从单一的普通话到方言,从方言免切换再发展到多语种多方言免切换,旨在满足不断发展变化的用户需求。进入大模型时代,输入法与大模型的能力深度耦合,表现出超乎想象的智能化和个性化。可以期待,未来的语音识别不仅能听懂我们的语言,更能感受我们的情绪,甚至预测我们的需求。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
邬贺铨:大模型下沉到手机 将激活万亿元规模手机产业
精彩专题
CES 2024国际消费电子展
2023年信息通信产业盘点暨颁奖礼
飞象网2023年手机评选
第24届中国国际光电博览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像