清晨的地铁站,人来人往。林女士又一次下意识地放慢脚步,低头假装看手机,与迎面走来的同事擦肩而过。这个看似寻常的早晨,对她而言却是一场无声的考验。
“以前上班路上,远远看到同事走过来,我第一反应就是绕道。”林女士回忆道,手指不自觉地摩挲着衣角,“不是不想打招呼,是怕自己发音不准,对方听不懂,也怕对方那种困惑的眼神。”
作为一名听障人士,林女士从小佩戴助听器,但在嘈杂环境中依然“听不清”。更让她困扰的是,长期缺乏语音练习让她陷入“不敢说、怕说错”的循环。她坦言,过去的生活像被困在一座“现代孤岛”——就医需要家人陪同,社交活动能推则推。
就在林女士几乎要习惯这种孤独时,转机悄然而至。今年年中,通过当地残联,她第一次接触到了中国移动开发的“中移无障碍”小程序。这个看似普通的手机应用,带领她开始了一段全新的语音康复之旅。
“第一次使用,系统让我读几句话,识别率只有30%左右。”林女士说这话时,眼中却带着光,“但它不像人那样会不耐烦,反而每次都会鼓励我。”这个小程序通过AI技术分析她的发音问题,精准指出声母、韵母的偏差,并通过波形图对比,让她第一次“看见”了自己的声音与标准音的差距。

用户的发音评分情况
随着使用次数的增加,系统会根据她的语音数据,逐步训练出“专属语音识别模型”,这个为她量身定制的AI助手,不仅用于日常训练,还能在实际沟通中,将她不清晰的语音实时转写成文字,让对方一目了然。
“以前去医院都得家人陪着,现在我自己去也没问题了。”林女士笑着展示手机界面:当她说“挂号”,屏幕上准确识别并显示出“挂号”二字。“这种感觉,像是终于有了一座桥,连接起了我和外面的世界。”
这些改变是如何发生的?“我们不仅是在做一款产品,更是在做一种陪伴。”中国移动互联网公司产品负责人给出了答案。原来,得益于中国移动遍布全国的智算中心和自研的发音质量评估算法,系统能够分析每位用户的发音弱点,针对性收集语音数据。

用户参加语音素材收集活动
研发团队通过深入理解听障群体发音的差异性,用AI技术识别归纳出20余种常见构音障碍类型,进行专项问题突破。“仅需传统方法三分之一的训练样本量,就能构建出个性化专属模型。”目前,模型平均识别率从初期不足30%提升至75%以上,部分用户接近90%。此外,研发团队还将个人专属模型压缩至百兆级别,使其轻松运行在普通手机上,大大降低了使用门槛,让更多人受益。
记者看到,目前该方案已集成至中国移动“5G新通话”,在通话中就可实现毫秒级语音转文字,借助“5G消息”识别对话场景智能生成快捷回复;在社交、就医等现场沟通场景中,“面对面助手”提供着精准的转写支持。
中国移动互联网公司产品负责人的感悟尤为深刻:“科技向善的意义,不仅仅是帮助听障群体,同时也是激发我们这些科技创新工作者人性之中向善的一面。双向奔赴的力量,才能唤醒大模型的力量。”
如今,在地铁站里,林女士不再躲避同事。她开始主动微笑、打招呼,甚至参与工作讨论。“虽然发音还不完美,但我知道,我在进步。”她说这话时,声音里透着从未有过的从容,“而这份进步,背后是科技带来的底气。”
在这个每一声“你好”都值得被听见的时代,技术正悄然成为那座无声的桥——它不只是一串串代码和算法,更是贯通听与说的纽带,连接你与我的桥梁,让曾经被困在孤岛上的心灵,重新融入世界的对话。