每日微信报
人物专访监管
制造芯片
6G 运营
大数据物联网
移动互联网量子
云计算互联网
报告卫星

识别率超75% AI听懂你的声音

2025年10月16日 17:49CCTIME飞象网

清晨的地铁站，人来人往。林女士又一次下意识地放慢脚步，低头假装看手机，与迎面走来的同事擦肩而过。这个看似寻常的早晨，对她而言却是一场无声的考验。

“以前上班路上，远远看到同事走过来，我第一反应就是绕道。”林女士回忆道，手指不自觉地摩挲着衣角，“不是不想打招呼，是怕自己发音不准，对方听不懂，也怕对方那种困惑的眼神。”

作为一名听障人士，林女士从小佩戴助听器，但在嘈杂环境中依然“听不清”。更让她困扰的是，长期缺乏语音练习让她陷入“不敢说、怕说错”的循环。她坦言，过去的生活像被困在一座“现代孤岛”——就医需要家人陪同，社交活动能推则推。

就在林女士几乎要习惯这种孤独时，转机悄然而至。今年年中，通过当地残联，她第一次接触到了中国移动开发的“中移无障碍”小程序。这个看似普通的手机应用，带领她开始了一段全新的语音康复之旅。

“第一次使用，系统让我读几句话，识别率只有30%左右。”林女士说这话时，眼中却带着光，“但它不像人那样会不耐烦，反而每次都会鼓励我。”这个小程序通过AI技术分析她的发音问题，精准指出声母、韵母的偏差，并通过波形图对比，让她第一次“看见”了自己的声音与标准音的差距。

用户的发音评分情况

随着使用次数的增加，系统会根据她的语音数据，逐步训练出“专属语音识别模型”，这个为她量身定制的AI助手，不仅用于日常训练，还能在实际沟通中，将她不清晰的语音实时转写成文字，让对方一目了然。

“以前去医院都得家人陪着，现在我自己去也没问题了。”林女士笑着展示手机界面：当她说“挂号”，屏幕上准确识别并显示出“挂号”二字。“这种感觉，像是终于有了一座桥，连接起了我和外面的世界。”

这些改变是如何发生的？“我们不仅是在做一款产品，更是在做一种陪伴。”中国移动互联网公司产品负责人给出了答案。原来，得益于中国移动遍布全国的智算中心和自研的发音质量评估算法，系统能够分析每位用户的发音弱点，针对性收集语音数据。

用户参加语音素材收集活动

研发团队通过深入理解听障群体发音的差异性，用AI技术识别归纳出20余种常见构音障碍类型，进行专项问题突破。“仅需传统方法三分之一的训练样本量，就能构建出个性化专属模型。”目前，模型平均识别率从初期不足30%提升至75%以上，部分用户接近90%。此外，研发团队还将个人专属模型压缩至百兆级别，使其轻松运行在普通手机上，大大降低了使用门槛，让更多人受益。

记者看到，目前该方案已集成至中国移动“5G新通话”，在通话中就可实现毫秒级语音转文字，借助“5G消息”识别对话场景智能生成快捷回复；在社交、就医等现场沟通场景中，“面对面助手”提供着精准的转写支持。

中国移动互联网公司产品负责人的感悟尤为深刻：“科技向善的意义，不仅仅是帮助听障群体，同时也是激发我们这些科技创新工作者人性之中向善的一面。双向奔赴的力量，才能唤醒大模型的力量。”

如今，在地铁站里，林女士不再躲避同事。她开始主动微笑、打招呼，甚至参与工作讨论。“虽然发音还不完美，但我知道，我在进步。”她说这话时，声音里透着从未有过的从容，“而这份进步，背后是科技带来的底气。”

在这个每一声“你好”都值得被听见的时代，技术正悄然成为那座无声的桥——它不只是一串串代码和算法，更是贯通听与说的纽带，连接你与我的桥梁，让曾经被困在孤岛上的心灵，重新融入世界的对话。

编辑：孙秀杰

飞象网版权及免责声明:
1.本网刊载内容，凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有，未经允许禁止转载、摘编及镜像，违者必究。对于经过授权可以转载，请必须保持转载文章、图像、音视频的完整性，并完整标注作者信息和飞象网来源。
2.凡注明“来源：XXXX”的作品，均转载自其它媒体，在于传播更多行业信息，并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题，请在相关作品刊发之日起30日内与本网联系，我们将第一时间予以处理。
本站联系电话为86-010-87765777，邮件后缀为cctime.com，冒充本站员工以任何其他联系方式，进行的“内容核实”、“商务联系”等行为，均不能代表本站。本站拥有对此声明的最终解释权。