首页|必读|视频|专访|运营|制造|监管|芯片|物联网|量子|低空经济|智能汽车|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|大数据|报告|智慧城市|移动互联网|会展
首页 >> 飞象原创 >> 正文

当“超级大脑”遇上“顺风耳”,移远通信为机器人注入智能灵魂

2025年7月8日 14:51  CCTIME飞象网  作 者:魏德龄

飞象原创(魏德龄/文)在2025MWC上海,早已对机器人演示项目司空见惯的观众,却在不断对着移远通信展台前的一台产品进行对话交互。

这台机器人诠释了关于“火种”与“变形金刚”间的故事,让很多业内人士开始考量,自己的传统设备是否也需要加上一个“灵魂大脑”,来实现语音交互、信息查询与指令执行等一系列功能。

对此,不妨先从系统架构的角度来剖析下,这台机器人是如何拥有了“灵魂大脑”的。

当机器人有了“灵魂大脑”

观众之所以能联想到自身行业的机器人产品升级,关键在于移远通信展示的机器人采用了一套融合方案,即机器人本体为逐际动力提供,通过连接一块搭载移远高算力AI模组SG885G、集成端侧本地模型的主控板,来帮助机器人解决思考与下达指令的问题。在实现交互方面,则配置麦克风阵列和喇叭,从而实现对现场观众的语音感知。

移远通信在2025MWC上海期间发布的“Robrain AI机器人解决方案”,如同“火种”一样,迅速让机器人获得“灵魂大脑”。该方案采用创新的端云协同架构及麦克风阵列拾音技术,深度融合端侧智能与云端大模型优势,赋予机器人接近人类的“思考”与“倾听”能力。有效攻克了AI模型定制、轻量化部署及低延迟交互响应等关键挑战,推动机器人从“机械执行”跃升为“主动感知、智能思考、自然交流”的AI智能体。

据了解,本次的演示机器人采用的是一套轻度融合方案,好处在于整合容易,相当于只需为固有设备提供一颗“大脑”,可以选择内置在本体或外挂,就能让机器人拥有“灵魂”,由于各模块相对独立,系统对接简单。

同时,移远通信还提供深度融合方案,采用一体化软硬件设计。在依旧沿用机器人本体的情况下,将机器人大脑主板与小脑主板合二为一。尽管需要产品人员具有一定开发能力,但整机可靠性更高,在生产过程中也更具成本优势。

而对于机器人的最终体验好坏与否来说,在融合方案内部的“超级大脑”与“顺风耳”到底能够发挥怎样的作用正是关键所在。

当“超级大脑”遇上“顺风耳”

从演示机器人的运转流程来看,主要分为三个部分:感知、决策、执行。

由于机器人采用语音交互的方式,所以在感知层需要进行前端声学处理,降低会场中的杂音,确定正在进行交流的声源内容,最终将准确的信息内容传递给决策层。

在决策层通过意图识别后,通过移远端&云混合大模型进行指令处理,端侧大模型与RAG本地知识库结合,确保实时控制中的快速反应与准确作答,云端大模型的接入让用户的一些查询、提问能够通过联网获取信息。

最终处理完的控制指令将通过机器人执行,机器人也能以语音播报的形式进行反馈。

显然,感知层的“顺风耳”与决策层“超级大脑”的产品能力,塑造了冰冷机器人的“有趣灵魂”。

“Robrain AI机器人解决方案”还拥有全链路音频处理能力,让机器人能够“听得见”,更能“听得清”。以2025MWC上海的会场环境为例,现场有着嘈杂的人声,不同展台的喇叭也在不时播放着自家的宣传,在巨大的室内环境中还存在着回声问题;同时,机器人内部也会在运转过程中伴有震动、电机、风扇等噪音。

移远通信Robrain AI机器人解决方案通过“麦克风阵列拾音+全链路音频算法”,为机器人添上了“顺风耳”的功能。6麦克风均匀分布在设备的圆环上,可以360度全向拾音,最大收录距离可达10米,唤醒率高达95%,±10.0°的DOA精度可以确保声源区域被增强。

有效的声音信号被收集后,相关算法会首先去除其中的干扰信号以及密闭空间中的回声,并通过AI降噪获得单纯的人声,同时还会自动调节音频增益,让输出音量保持在合适的幅度。

“回声消除、声源定位、波束成型、降噪、去混响、自动增益以及语音唤醒等一系列前端数据处理,确保了大模型识别的准确率。”移远通信产品经理王宗武表示。

当清晰明了的声音内容输入到“超级大脑”后,Robrain AI机器人解决方案中的端&云混合大模型同样分工明确。其中,为了让机器人能够如同真人一样在沟通交流中做出及时反馈,并且不依赖于网络环境,85%的运算将在端侧大模型进行,做到时延小于1秒,并且不占用过多算力资源。对于一些与产品相关的问题,端侧大模型还能读取本地RAG知识库,满足商业化需求,减少通用大模型在专业领域容易出现的“幻觉”问题。移远通信产品经理王柯将这一过程比喻为:“大模型在本地进行‘开卷考试’,机器人如同自带一个本地学霸。”从成本侧考虑,RAG的方式也比企业根据自身数据内容进行私域训练耗费资源更少,且落地更快。

方案中的云端大模型则提供了扩充整体方案的能力,通过与通用大模型进行合作,可以轻松接入互联网资源,帮助进行内容搜索、新闻播报,或提供影音娱乐服务。例如在2025MWC上海的展区演示中,当现场观众询问“明天天气怎么样?”的时候,演示机器人能够快速做出回答。

实际上,移远通信在2025MWC上海展示的机器人并非“超级大脑”+“顺风耳”这对天作之合的孤例。依托移远通信端侧AI整体解决方案,今年3月联合德壹所发布的全能王AI具身机器人,在无需理疗师介入、无网络连接的环境下,可快速且准确地理解用户通过自然语言提出的指令和意图,高效完成通用聊天、医疗领域RAG问答、指令控制等任务。该机器人搭载高通QCS8550平台,其意图识别小于1s、Prefill时间小于2s,同时,超过15 tokens/s解码速率也确保了交互的实时性。

正如这台能够代替一定理疗师工作的机器人,当具身智能来到生活中的每个场景,移远通信正在准备将这对“天作之合”的能力进行进一步升级。

当具身智能走向未来

“我的个人建议是把大模型当做人一样。”王柯表示,大模型方案将在如今文本和语音基础上,引入视觉能力的支持,届时,机器人将能够通过视觉看到交流者的表情,从而提升和扩展方案的适用性。与此同时,在与多名对象的交流过程中,视觉也能帮助机器人更好地判断说话人的转换。最终,视觉将与文本、语音一并,构成机器人的多模态感知能力。

移远通信还正在思考,如何解决当前Transformer架构下的主流大模型对算力内存消耗比较大的问题。目前正在关注非Transformer架构的RWKV大语言模型,并已在SG885G模组上成功运行RWKV7模型,将为机器人带来更高效、内存占用更小的能力。

在语音交互的演进方面,移远通信同样聚焦在多维感知的方向上。例如,在目前的交互开启环节,语音唤醒还只是基础层面,如果需要能够锁定个人对象的识别开启,就需要引入声纹识别或人脸唤醒。同时,声纹或声源与人脸、人体的结合,更有利于保持交互状态,从而做出更准确的语义判断。人脸锁定功能也可以在多人对话中,通过重新锁定人脸来切换对话信息的收集。另外,在最后结束交互的环节,移远通信也正在让机器人能够以比较友好的方式进行表达,比如说“我累了”或“我想休息了”。

当“超级大脑”遇上“顺风耳”,正在如同儿时动画片中的“火种”一般,为众多机器人赋予全新的智能灵魂,让冰冷的机身展现出思考与表达的“火花”。随着具身智能开始走向生活中的每一个角落,移远通信也正在推动儿时的科幻想象成为美好现实。

编 辑:路金娣
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐新闻              
 
人物
飞象访谈:对话InterDigital副总裁兼无线实验室负责人Milind Kulkarni
精彩视频
飞象趣谈第二十九期!物流无人机,低空经济崛起中的“双轮引擎”
未来出行的芯力量 向“智能移动终端”跃迁
飞象访谈:对话InterDigital副总裁兼无线实验室负责人Milind Kulkarni
2025MWC上海丨中兴通讯副总裁熊杰就AI万兆全光园区话题进行交流
精彩专题
2025 MWC 上海
2025工业互联网大会
2025世界电信和信息社会日大会
第八届数字中国建设峰会
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像