当“超级大脑”遇上“顺风耳”，移远通信为机器人注入智能灵魂 -- 飞象网

飞象原创（魏德龄/文）在2025MWC上海，早已对机器人演示项目司空见惯的观众，却在不断对着移远通信展台前的一台产品进行对话交互。

这台机器人诠释了关于“火种”与“变形金刚”间的故事，让很多业内人士开始考量，自己的传统设备是否也需要加上一个“灵魂大脑”，来实现语音交互、信息查询与指令执行等一系列功能。

对此，不妨先从系统架构的角度来剖析下，这台机器人是如何拥有了“灵魂大脑”的。

当机器人有了“灵魂大脑”

观众之所以能联想到自身行业的机器人产品升级，关键在于移远通信展示的机器人采用了一套融合方案，即机器人本体为逐际动力提供，通过连接一块搭载移远高算力AI模组SG885G、集成端侧本地模型的主控板，来帮助机器人解决思考与下达指令的问题。在实现交互方面，则配置麦克风阵列和喇叭，从而实现对现场观众的语音感知。

移远通信在2025MWC上海期间发布的“Robrain AI机器人解决方案”，如同“火种”一样，迅速让机器人获得“灵魂大脑”。该方案采用创新的端云协同架构及麦克风阵列拾音技术，深度融合端侧智能与云端大模型优势，赋予机器人接近人类的“思考”与“倾听”能力。有效攻克了AI模型定制、轻量化部署及低延迟交互响应等关键挑战，推动机器人从“机械执行”跃升为“主动感知、智能思考、自然交流”的AI智能体。

据了解，本次的演示机器人采用的是一套轻度融合方案，好处在于整合容易，相当于只需为固有设备提供一颗“大脑”，可以选择内置在本体或外挂，就能让机器人拥有“灵魂”，由于各模块相对独立，系统对接简单。

同时，移远通信还提供深度融合方案，采用一体化软硬件设计。在依旧沿用机器人本体的情况下，将机器人大脑主板与小脑主板合二为一。尽管需要产品人员具有一定开发能力，但整机可靠性更高，在生产过程中也更具成本优势。

而对于机器人的最终体验好坏与否来说，在融合方案内部的“超级大脑”与“顺风耳”到底能够发挥怎样的作用正是关键所在。

当“超级大脑”遇上“顺风耳”

从演示机器人的运转流程来看，主要分为三个部分：感知、决策、执行。

由于机器人采用语音交互的方式，所以在感知层需要进行前端声学处理，降低会场中的杂音，确定正在进行交流的声源内容，最终将准确的信息内容传递给决策层。

在决策层通过意图识别后，通过移远端&云混合大模型进行指令处理，端侧大模型与RAG本地知识库结合，确保实时控制中的快速反应与准确作答，云端大模型的接入让用户的一些查询、提问能够通过联网获取信息。

最终处理完的控制指令将通过机器人执行，机器人也能以语音播报的形式进行反馈。

显然，感知层的“顺风耳”与决策层“超级大脑”的产品能力，塑造了冰冷机器人的“有趣灵魂”。

“Robrain AI机器人解决方案”还拥有全链路音频处理能力，让机器人能够“听得见”，更能“听得清”。以2025MWC上海的会场环境为例，现场有着嘈杂的人声，不同展台的喇叭也在不时播放着自家的宣传，在巨大的室内环境中还存在着回声问题；同时，机器人内部也会在运转过程中伴有震动、电机、风扇等噪音。

移远通信Robrain AI机器人解决方案通过“麦克风阵列拾音+全链路音频算法”，为机器人添上了“顺风耳”的功能。6麦克风均匀分布在设备的圆环上，可以360度全向拾音，最大收录距离可达10米，唤醒率高达95%，±10.0°的DOA精度可以确保声源区域被增强。

有效的声音信号被收集后，相关算法会首先去除其中的干扰信号以及密闭空间中的回声，并通过AI降噪获得单纯的人声，同时还会自动调节音频增益，让输出音量保持在合适的幅度。

“回声消除、声源定位、波束成型、降噪、去混响、自动增益以及语音唤醒等一系列前端数据处理，确保了大模型识别的准确率。”移远通信产品经理王宗武表示。

当清晰明了的声音内容输入到“超级大脑”后，Robrain AI机器人解决方案中的端&云混合大模型同样分工明确。其中，为了让机器人能够如同真人一样在沟通交流中做出及时反馈，并且不依赖于网络环境，85%的运算将在端侧大模型进行，做到时延小于1秒，并且不占用过多算力资源。对于一些与产品相关的问题，端侧大模型还能读取本地RAG知识库，满足商业化需求，减少通用大模型在专业领域容易出现的“幻觉”问题。移远通信产品经理王柯将这一过程比喻为：“大模型在本地进行‘开卷考试’，机器人如同自带一个本地学霸。”从成本侧考虑，RAG的方式也比企业根据自身数据内容进行私域训练耗费资源更少，且落地更快。

方案中的云端大模型则提供了扩充整体方案的能力，通过与通用大模型进行合作，可以轻松接入互联网资源，帮助进行内容搜索、新闻播报，或提供影音娱乐服务。例如在2025MWC上海的展区演示中，当现场观众询问“明天天气怎么样？”的时候，演示机器人能够快速做出回答。

实际上，移远通信在2025MWC上海展示的机器人并非“超级大脑”+“顺风耳”这对天作之合的孤例。依托移远通信端侧AI整体解决方案，今年3月联合德壹所发布的全能王AI具身机器人，在无需理疗师介入、无网络连接的环境下，可快速且准确地理解用户通过自然语言提出的指令和意图，高效完成通用聊天、医疗领域RAG问答、指令控制等任务。该机器人搭载高通QCS8550平台，其意图识别小于1s、Prefill时间小于2s，同时，超过15 tokens/s解码速率也确保了交互的实时性。

正如这台能够代替一定理疗师工作的机器人，当具身智能来到生活中的每个场景，移远通信正在准备将这对“天作之合”的能力进行进一步升级。

当具身智能走向未来

“我的个人建议是把大模型当做人一样。”王柯表示，大模型方案将在如今文本和语音基础上，引入视觉能力的支持，届时，机器人将能够通过视觉看到交流者的表情，从而提升和扩展方案的适用性。与此同时，在与多名对象的交流过程中，视觉也能帮助机器人更好地判断说话人的转换。最终，视觉将与文本、语音一并，构成机器人的多模态感知能力。

移远通信还正在思考，如何解决当前Transformer架构下的主流大模型对算力内存消耗比较大的问题。目前正在关注非Transformer架构的RWKV大语言模型，并已在SG885G模组上成功运行RWKV7模型，将为机器人带来更高效、内存占用更小的能力。

在语音交互的演进方面，移远通信同样聚焦在多维感知的方向上。例如，在目前的交互开启环节，语音唤醒还只是基础层面，如果需要能够锁定个人对象的识别开启，就需要引入声纹识别或人脸唤醒。同时，声纹或声源与人脸、人体的结合，更有利于保持交互状态，从而做出更准确的语义判断。人脸锁定功能也可以在多人对话中，通过重新锁定人脸来切换对话信息的收集。另外，在最后结束交互的环节，移远通信也正在让机器人能够以比较友好的方式进行表达，比如说“我累了”或“我想休息了”。

当“超级大脑”遇上“顺风耳”，正在如同儿时动画片中的“火种”一般，为众多机器人赋予全新的智能灵魂，让冰冷的机身展现出思考与表达的“火花”。随着具身智能开始走向生活中的每一个角落，移远通信也正在推动儿时的科幻想象成为美好现实。