苹果连发 3 项 AI 研究,推进空间计算与 Vision Pro 头显方向
科技媒体 Appleinsider 昨日(5 月 11 日)发布博文,报道称基于最新公开的 3 项研究,苹果仍在积极推进空间计算和 Vision Pro 头显。
4 月援引 MacRumors 媒体报道,苹果公司内部已搁置研发新款 Vision Pro,团队重心转向 Siri 和 AI 智能眼镜。
但从最新公示的研究论文来看,苹果公司并未放弃 Vision Pro 头显项目,本轮公开了 3 项研究,分别涉及多模态大模型空间推理评测、美式手语视频标注,以及 3D 头部重建。
其中最直接的一项,是苹果在机器学习博客发布的《From Where Things Are to What They’re For:Benchmarking Spatial-Functional Intelligence for Multimodal LLMs》。
这篇论文提出 SFI-Bench,用来测试多模态大模型是否既看懂空间布局,也理解物体“能做什么”。原文提到,这套视频基准包含 134 段室内视频扫描,并整理出 1555 道专家标注问题。
SFI-Bench 不只问模型“这是什么、在哪里”,还会追问“它怎么用、出了故障怎么办”。例如,模型可能需要从柜子里找出同品牌数量最多的一组瓶子,理解洗衣机当前程序如何取消,或者判断电视遥控器的用途。相比只测空间识别的旧方法,这更接近日常家庭场景,也更像未来空间助手需要处理的真实任务。
苹果公司的人工智能研究人员测试了智能体(LLM)对周围世界的理解能力。
测试结果显示,Google Gemini 3.1 Pro 总分最高,OpenAI GPT-5.4-High 排名第二,Gemini-3.1-Flash-Lite 排名第三。
但论文也点出共同短板:几乎所有模型都不擅长“带条件的全局计数”,并且在空间记忆、功能知识整合,以及把眼前画面和外部知识连起来这几件事上仍有明显限制。
手语论文《Bootstrapping Sign Language Annotations with Sign Language Models》尝试用 AI 自动生成候选标注,减少数百小时手工标注成本。
苹果公司的研究人员探索了使用人工智能进行美国手语(ASL)标注的可能性。
原文称,团队建立了近 500 条人工英文字词到术语标注,并扩展到超过 300 小时 ASL STEM Wiki 和 7.5 小时 FLEURS-ASL 数据。其手指拼写模型在 FSBoard 上达到 6.7% CER,在 ASL Citizen 数据集上达到 74% top-1 准确率。
第三项研究《Large-Scale High-Quality 3D Gaussian Head Reconstruction from Multi-View Captures》则聚焦 3D 头像重建。
苹果公司的人工智能研究人员探索了如何利用 LLM(层级建模)技术,从多角度拍摄的图像中创建 3D 头部模型。
苹果提出 HeadsUp 方法,可从大规模多摄像头采集中重建高质量 3D Gaussian 头部模型。测试使用了一个超过 10000 名受试者的内部数据集,规模比现有多视角人头数据集高一个数量级。这可能和 Vision Pro 的 Persona,或 visionOS 中更自然的人脸捕捉与表情渲染有关。
苹果公司全球营销高级副总裁格雷格 · 乔斯维亚克(Greg Joswiak)此前表示,Vision Pro 展示了数字世界与物理世界融合的未来形态,这种融合具有必然性。当被问及具体时间表时,他坦言无法预测“空间计算”何时能成为主流,但坚信这一方向不可逆转。
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
2026十大科技趋势
2026 十大科技趋势,定义新一年的每一次突破。祝大家马年大吉,马到成功!初八启新程,万事皆顺遂!
[详细]
工业AI融合困境重重,如何破局?
推进新型工业化,是我国建设制造强国的核心路径,而人工智能作为新一轮科技革命的核心技术,正成为制造业高端化、智能化、绿色化转型的关键引擎。当下,我国制造业与AI融合已从单点技术试点..[详细]
下好AI时代一盘大棋:中国移动如何打造“智能新空间”
随着AI能力持续迭代、应用可靠性稳步提升,AI 智能体加速向千行百业渗透,深度融入大众生产生活,智能时代已在眼前。在AI大潮中,中国移动又将如何拥抱新[详细]
铸信致远 自立自强:中国信科凝聚品牌力量,点亮通信未来
作为信息通信领域中央企业国家队,中国信科立足创新引领、国之重器、匠心坚守核心品牌精神,以科技自立自强为根本遵循,深耕光通信、6G、卫星互联网、人工智能等前沿战略赛道,以硬核技术、..[详细]
体验新经营!5G-AxAI打造“山海智联第一城”
走进福州烟台山景区,随处可见赏心悦目的哥特式、古罗马式近现代建筑,这里原本是游客们的天堂,现在也是线上直播的天堂。徜徉在景区里,经常能碰到旅游主播在轻声细语地讲述景点故事,生活..[详细]
手机电脑内存过度焦虑?个人设备找到平衡点即可
随着内存的价格上涨,以及预测显示此轮上涨至2027年底可能都不会有好转,从而引发了很多消费者在当下时间点进行消费电子产品选购时的内存焦虑。
无论是手机或电脑,此前内存的预设配置基..[详细]中国电信打造五位一体智能云,发力Token经济
当前,人工智能技术迭代持续提速,智能体应用加速普及,Token成本不断下降、需求呈爆发式增长,Token经济已成为智能时代经济发展的新引擎,为数据要素价值释放与AI产业规模化落地开辟全新路..[详细]
FTTR用户逆势增长,AI成为宽带价值升级核心引擎
随着数字经济向纵深发展,千兆光网普及进入攻坚阶段,FTTR(光纤到房间)正加速突破家庭组网边界,向园区、政企、城市光网等多场景延伸,成为全光接入网络升级的核心载体。而AI技术的深度融..[详细]
495.8万基站背后:中国数字基建如何从“有”到“优”?
作为新型数字基建核心抓手,全国“信号升格”行动持续纵深推进,并取得丰硕成果。4月21日,在国务院新闻办公室举行的新闻发布会上,工信部副部长张云明介绍了2026年一季度我国工业和信息化的..[详细]
28年后愿望已成的蓝牙,战略布局四大发展方向
1998年5月,爱立信、IBM、英特尔、诺基亚以及东芝达成一个共同愿景,成立如今的蓝牙技术联盟,以便能够在全球实施一个互联互通、低成本的无线技术愿景。当时他们的想法是,如果想建立一个全..[详细]













