当“超级大脑”遇上“顺风耳”,移远通信为机器人注入智能灵魂
飞象原创(魏德龄/文)在2025MWC上海,早已对机器人演示项目司空见惯的观众,却在不断对着移远通信展台前的一台产品进行对话交互。
这台机器人诠释了关于“火种”与“变形金刚”间的故事,让很多业内人士开始考量,自己的传统设备是否也需要加上一个“灵魂大脑”,来实现语音交互、信息查询与指令执行等一系列功能。
对此,不妨先从系统架构的角度来剖析下,这台机器人是如何拥有了“灵魂大脑”的。
当机器人有了“灵魂大脑”
观众之所以能联想到自身行业的机器人产品升级,关键在于移远通信展示的机器人采用了一套融合方案,即机器人本体为逐际动力提供,通过连接一块搭载移远高算力AI模组SG885G、集成端侧本地模型的主控板,来帮助机器人解决思考与下达指令的问题。在实现交互方面,则配置麦克风阵列和喇叭,从而实现对现场观众的语音感知。
移远通信在2025MWC上海期间发布的“Robrain AI机器人解决方案”,如同“火种”一样,迅速让机器人获得“灵魂大脑”。该方案采用创新的端云协同架构及麦克风阵列拾音技术,深度融合端侧智能与云端大模型优势,赋予机器人接近人类的“思考”与“倾听”能力。有效攻克了AI模型定制、轻量化部署及低延迟交互响应等关键挑战,推动机器人从“机械执行”跃升为“主动感知、智能思考、自然交流”的AI智能体。
据了解,本次的演示机器人采用的是一套轻度融合方案,好处在于整合容易,相当于只需为固有设备提供一颗“大脑”,可以选择内置在本体或外挂,就能让机器人拥有“灵魂”,由于各模块相对独立,系统对接简单。
同时,移远通信还提供深度融合方案,采用一体化软硬件设计。在依旧沿用机器人本体的情况下,将机器人大脑主板与小脑主板合二为一。尽管需要产品人员具有一定开发能力,但整机可靠性更高,在生产过程中也更具成本优势。
而对于机器人的最终体验好坏与否来说,在融合方案内部的“超级大脑”与“顺风耳”到底能够发挥怎样的作用正是关键所在。
当“超级大脑”遇上“顺风耳”
从演示机器人的运转流程来看,主要分为三个部分:感知、决策、执行。
由于机器人采用语音交互的方式,所以在感知层需要进行前端声学处理,降低会场中的杂音,确定正在进行交流的声源内容,最终将准确的信息内容传递给决策层。
在决策层通过意图识别后,通过移远端&云混合大模型进行指令处理,端侧大模型与RAG本地知识库结合,确保实时控制中的快速反应与准确作答,云端大模型的接入让用户的一些查询、提问能够通过联网获取信息。
最终处理完的控制指令将通过机器人执行,机器人也能以语音播报的形式进行反馈。
显然,感知层的“顺风耳”与决策层“超级大脑”的产品能力,塑造了冰冷机器人的“有趣灵魂”。
“Robrain AI机器人解决方案”还拥有全链路音频处理能力,让机器人能够“听得见”,更能“听得清”。以2025MWC上海的会场环境为例,现场有着嘈杂的人声,不同展台的喇叭也在不时播放着自家的宣传,在巨大的室内环境中还存在着回声问题;同时,机器人内部也会在运转过程中伴有震动、电机、风扇等噪音。
移远通信Robrain AI机器人解决方案通过“麦克风阵列拾音+全链路音频算法”,为机器人添上了“顺风耳”的功能。6麦克风均匀分布在设备的圆环上,可以360度全向拾音,最大收录距离可达10米,唤醒率高达95%,±10.0°的DOA精度可以确保声源区域被增强。
有效的声音信号被收集后,相关算法会首先去除其中的干扰信号以及密闭空间中的回声,并通过AI降噪获得单纯的人声,同时还会自动调节音频增益,让输出音量保持在合适的幅度。
“回声消除、声源定位、波束成型、降噪、去混响、自动增益以及语音唤醒等一系列前端数据处理,确保了大模型识别的准确率。”移远通信产品经理王宗武表示。
当清晰明了的声音内容输入到“超级大脑”后,Robrain AI机器人解决方案中的端&云混合大模型同样分工明确。其中,为了让机器人能够如同真人一样在沟通交流中做出及时反馈,并且不依赖于网络环境,85%的运算将在端侧大模型进行,做到时延小于1秒,并且不占用过多算力资源。对于一些与产品相关的问题,端侧大模型还能读取本地RAG知识库,满足商业化需求,减少通用大模型在专业领域容易出现的“幻觉”问题。移远通信产品经理王柯将这一过程比喻为:“大模型在本地进行‘开卷考试’,机器人如同自带一个本地学霸。”从成本侧考虑,RAG的方式也比企业根据自身数据内容进行私域训练耗费资源更少,且落地更快。
方案中的云端大模型则提供了扩充整体方案的能力,通过与通用大模型进行合作,可以轻松接入互联网资源,帮助进行内容搜索、新闻播报,或提供影音娱乐服务。例如在2025MWC上海的展区演示中,当现场观众询问“明天天气怎么样?”的时候,演示机器人能够快速做出回答。
实际上,移远通信在2025MWC上海展示的机器人并非“超级大脑”+“顺风耳”这对天作之合的孤例。依托移远通信端侧AI整体解决方案,今年3月联合德壹所发布的全能王AI具身机器人,在无需理疗师介入、无网络连接的环境下,可快速且准确地理解用户通过自然语言提出的指令和意图,高效完成通用聊天、医疗领域RAG问答、指令控制等任务。该机器人搭载高通QCS8550平台,其意图识别小于1s、Prefill时间小于2s,同时,超过15 tokens/s解码速率也确保了交互的实时性。
正如这台能够代替一定理疗师工作的机器人,当具身智能来到生活中的每个场景,移远通信正在准备将这对“天作之合”的能力进行进一步升级。
当具身智能走向未来
“我的个人建议是把大模型当做人一样。”王柯表示,大模型方案将在如今文本和语音基础上,引入视觉能力的支持,届时,机器人将能够通过视觉看到交流者的表情,从而提升和扩展方案的适用性。与此同时,在与多名对象的交流过程中,视觉也能帮助机器人更好地判断说话人的转换。最终,视觉将与文本、语音一并,构成机器人的多模态感知能力。
移远通信还正在思考,如何解决当前Transformer架构下的主流大模型对算力内存消耗比较大的问题。目前正在关注非Transformer架构的RWKV大语言模型,并已在SG885G模组上成功运行RWKV7模型,将为机器人带来更高效、内存占用更小的能力。
在语音交互的演进方面,移远通信同样聚焦在多维感知的方向上。例如,在目前的交互开启环节,语音唤醒还只是基础层面,如果需要能够锁定个人对象的识别开启,就需要引入声纹识别或人脸唤醒。同时,声纹或声源与人脸、人体的结合,更有利于保持交互状态,从而做出更准确的语义判断。人脸锁定功能也可以在多人对话中,通过重新锁定人脸来切换对话信息的收集。另外,在最后结束交互的环节,移远通信也正在让机器人能够以比较友好的方式进行表达,比如说“我累了”或“我想休息了”。
当“超级大脑”遇上“顺风耳”,正在如同儿时动画片中的“火种”一般,为众多机器人赋予全新的智能灵魂,让冰冷的机身展现出思考与表达的“火花”。随着具身智能开始走向生活中的每一个角落,移远通信也正在推动儿时的科幻想象成为美好现实。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
5G-A赋能机器人火炬接力:中国移动以技术革新点亮全运科技盛宴
2025年11月,第十五届全国运动会将在粤港澳三地盛大启幕。这场赛事不仅是体育健儿的竞技场,更是前沿科技落地应用的“试验田”。其中,11月2日的机器人火炬接力作为本次全运会的核心创新亮点..[详细]
轻薄机型出师未捷身先死,长使业绩泪满襟
当iPhone Air宣布上市当天,随着各路评测内容解禁,一个显眼的标题也随之出现,那就是“注定停产”。轻薄机型的出现一方面让人们看到厂商正在挖掘全新市场空间,另一方面也勾起了小尺寸机型..[详细]
智能未来:宇宙为你闪烁
未来十年,你家的电表可能再也不用换电池,自动驾驶汽车能"看到"几公里外的路况,甚至海洋深处的传感器都能实时传回数据。这些不是科幻,而是刚刚在无锡物博会上发布的《2025全球..[详细]
智能IP广域网成为筑牢智算产业发展根基的关键一环
随着国家加速推动智算产业高质量发展,网络支撑能力已成为产业进阶的核心抓手,而作为关键基础设施的智能IP广域网,正凭借其在算力调度、数据传输中的核心作用,成为筑牢智算产业发展根基的..[详细]
大中华区市场失守 苹果寄望AI驱动未来增长
苹果公司公布的2025 财年第四季度财报呈现“冰火两重天”态势:全球营收1024.66亿美元同比增长 8%,净利润274.66亿美元同比激增86.4%,毛利率攀升至 47.18%。但作为第三大市场的大中华区却成..[详细]













