首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网 >> 正文

星火语音大模型首发 讯飞输入法AI能力将获提升

2024年1月31日 11:36  CCTIME飞象网  

   1月30日,科大讯飞举办星火认知大模型V3.5升级发布会,展示大模型底层能力到应用场景的新发展,同时也发布了讯飞语音大模型。科大讯飞董事长刘庆峰表示,“今天的通用人工智能必将像PC和互联网的诞生一样,深刻改变人类的生产生活方式。”随着星火认知大模型V3.5的发布,讯飞输入法借新技术持续赋能,不断升级生成式AI输入能力,在万物互联时代带来更出众的人机交互体验。

2023年8月,讯飞输入法推出“AI创作助手”,覆盖6大表达场景,适配60多款应用,使亿万用户感受大模型的“模”力。同年10月,讯飞输入法全新发布13.0,量身定制“高情商沟通”、“润色达人”、“智能回复”、“帮你扩写”等场景化功能,提供生成式AI输入服务。2024年1月30日,讯飞星火V3.5已在语言理解、数学能力上超过了GPT-4 Turbo。与此同时,讯飞输入法基于星火大模型的底座和用户新生需求,生成式AI能力再提升,匹配更多元的场景,拥有更深层的理解,生成更丰富的表达。

“讯飞星火的技术进步,来源于真实世界刚需。”

创业之初,科大讯飞的梦想和使命就是要实现人机信息沟通无障碍。当下的大模型带来了语音技术发展的全新机会,使语音识别可以进一步突破高噪、远场、多人说话这些传统的“鸡尾酒会语音识别”重大难题。这一次基于大语言模型框架,结合讯飞多维度语音属性解耦表征预训练,正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,全新升级助力更自由的沟通,推动万物互联时代下的人机交互变革。

科大讯飞创业25年来,在智能语音这条赛道上一路驰骋,持续走在世界前列。2006-2019年,连续十四年蝉联国际语音合成大赛冠军;2016-2023年,连续4届获得国际多通道语音分离和识别比赛CHIME冠军;2021-2023年,连续三年获得国际语音翻译比赛IWSLT赛道冠军;还参与承建首批国家新一代人工智能开放创新平台、语音及语言信息处理国家工程研究中心等,在语音领域持续积累。

此次星火语音大模型将识别、翻译和多语种分类等多种功能统一交换并进行训练,实现了多种任务信息的共通,会对整体任务产生促进作用,使语音识别效果大幅提升。其中,多语种自动识别已覆盖37种,端到端语音翻译超过13个。在训练层面,通过两种方式,即多模态理解和多模态生成两种任务的协同训练,来实现多模态的协同。

深耕互联网行业14年,讯飞输入法搭载AI语音输入,支持26种方言、5种民族语言以及30种外语,令表达更方便、更透彻,同时能够理解上下文语义关联。在星火语音大模型赋能下,全语音自然交互的讯飞输入法旨在实现智慧表达,智能连接。

当下,生成式AI的赋能已经成为一种趋势。对于大众而言,一款生成式AI输入法,是最方便、最直接、最轻量的大模型使用端口,打字就能使用生成式AI的多模态服务。可以看到,源于真实世界刚需的产品创新,在应用场景和社会价值方面潜力巨大。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像