首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网旧 >> 正文

2018年语音识别行业评测

2018年11月12日 15:39  CCTIME飞象网  

  大家好,现在已经到了2018年的年底了,作为一个语音识别行业内的工作者,我想写一篇文章,来给大家实际测试一下,目前市面上各大"语音识别"引擎的实际识别效果,作为学习交流参考。

  一、识别引擎

  1、捷通华声(支持中文、英文、粤语)

  2、云知声(支持中文)

  3、百度(支持中文、英文、粤语)

  4、科大讯飞(支持中文、英文、粤语、等十四种方言以上)

  5、阿里云(支持中文)

  6、有道云(支持中文以及英语)

  二、测试项目

  声音内容涉及:时间、地区、常用语、人名、金额、新闻稿内容

  1。近距离录音测试(首先我们会准备一段对着手机以及录音笔说话的清晰录音,测试以上6款识别引擎识别的效果)

  2。远距离录音测试(我们会准备二段录音,分别距离为1米和3米,采用录音笔以及手机进行录音,并测试声音识别情况,对比各家识别引擎的错误率)

  3。新闻稿发音人声音测试(采用标准发音,慢速测试每个识别引擎的识别情况,对比正确率)

  三、测试参数

  为了保证测试的公平性,所有测试录音,统一转换为

  采样率 :16000

  编码:16bit 位深的单声道。

  手机:Galaxys9+

  录音笔:新科V-19

  语音识别软件:录音啦

  录音环境:室内会议室(无杂音)

  语言类型:中文普通话

IMG_256

  四、测试过程

IMG_257

  测试距离1米远录音

IMG_258

  测试距离3米远录音

  一、手机录音”近距离[演讲稿]:

  北京时间11月12日,2018-2019赛季短道速滑世界杯第二站在美国盐湖城继续进行,在男子500米比赛中武大靖以39秒505的成绩夺冠,并打破自己在平昌冬奥会上创造的39秒584的世界纪录。继上周两次登顶后,武大靖在500米项目上实现三连冠,成为该项目上当之无愧的霸主。

  二、“手机录音”识别引擎近距离[演讲稿]识别结果

IMG_259
IMG_260

  三、“手机录音”1米远距离录音原文:

  关于王总的商业报告书我看了,大家打开第九页,文章中提到了“语音识别”行业的发展趋势正在迅速发展,我希望大家能够牢牢把握机会,争取在2018年的年底,把11月份,12月份的资料。详细的数据整理出来

  四、“手机录音”识别引擎1米远录音识别结果

IMG_261
IMG_262

  五、“手机录音”3米远距离录音原文:

  2003年12月24日开工建设,2008年3月完工,总造价22.67亿元。作为国家标志性建筑,2008年奥运会主体育场,国家体育场结构特点十分显著。体育场为特级体育建筑,大型体育场馆。主体结构设计使用年限100年,耐火等级为一级,抗震设防烈度8度,地下工程防水等级1级。

  六、“手机录音”识别引擎3米远录音识别结果

IMG_263
IMG_264

  七、录音笔”近距离原文:

  今天是2018年11月12日,我们在广东省广州市番禺区市桥街,小明将给大家介绍一下周杰伦演唱的歌曲,如“黑色毛衣”“七里香”等歌曲,都充满了年轻人的回忆。

  八、录音笔”近距离识别结果:

IMG_265
IMG_266

  九、录音笔”3米距离[演讲稿]:

  2003年12月24日开工建设,2008年3月完工,总造价22.67亿元。作为国家标志性建筑,2008年奥运会主体育场,国家体育场结构特点十分显著。体育场为特级体育建筑,大型体育场馆。主体结构设计使用年限100年,耐火等级为一级,抗震设防烈度8度,地下工程防水等级1级。

  十、录音笔”3米距离识别结果:

IMG_267
IMG_268

  十一、得出对比图以及结论

  评分规则:

  1。最佳得:3分

  2。推荐得:2分

  3。效果不理想得:1 分

IMG_269

  总结:

  1。在近距离的"手机"和"录音笔"录音中,各大识别引擎识别出来的文字效果都不错,会存在部分错别字,对于数字类的识别,推荐选用“云知声”,文字显示的比较直观,对于人名,歌曲名,捷通华声、云知声、科大讯飞、阿里云、有道云的识别效果都非常不错

  2。录音距离超过或者等于3米的,首选“云知声”识别引擎,丢字率比较低,识别的完整性较高

  3。对比“手机”和“录音笔”由于手机属于近距离录音设备,在对比三米录音距离下,除了“云知声”其他的识别引擎文字丢失率比较严重。

  4。对于近距离的录音,每个识别引擎出来的文字相差不大

  5。请注意!本次测试仅限与学习交流,实际不同录音识别效果会有差异

  感谢您的阅读,如果有什么疑问或建议,欢迎在评论区评论……

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像