必读视频专题飞象趣谈光通信人工智能低空经济5G手机智能汽车智慧城市会展特约记者

苹果StreamBridge视频模型框架问世,Meta/微美全息加速多模态AI技术创新

2025年5月20日 10:14CCTIME飞象网

据消息,有科技媒体发布博文,报道称苹果(AAPL.US)公司联合复旦大学,推出 StreamBridge 端侧视频大语言模型(Video-LLMs)框架,助力 AI 理解直播流视频。

 

一般而言,传统视频大语言模型擅长处理静态视频,但无法适应机器人技术和自动驾驶等需要实时感知的场景,在这些场景下,要求模型能快速理解直播视频流内容,并做出反应。

 

研发StreamBridge框架与创新技术

为解决上述问题,苹果公司与复旦大学的研究者开发了 StreamBridge 框架。该框架在主流离线模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上进行了测试。

 

此外,研究团队还推出了 Stream-IT 数据集,包含约 60 万个样本,融合了视频与文本序列,支持多样化的指令格式,旨在提升流式视频理解能力。

Meta开发款AI模型应用

与此同时,还值得关注的是,Meta(META.US)首次推出了与Ray-Ban Meta进行强捆绑的《Meta AI》APP。Meta AI是一个Meta所打造的AI助手,由自家研发的Llama大语言模型驱动。

最新数据指出,Meta AI的月活用户已经接近10亿,用户主要入口自然是前面所提到的这些社交应用,体验到相关功能。上个月月底,Meta举办了其首个AI开发者大会LlamaCon,期间Meta推出了其最新的Llama 4系列大语言模型。

 

不可否认,大模型不断赋能行业发展,AI数字化浪潮奔涌向前,加快各行业转型发展步伐,各企业积极开展人工智能场景建设,成功完成人工智能大模型本地化部署及场景适配,将AI落地应用到实际业务场景,推动AI技术的发展与升级。

微美全息布局AI生态扩展创新边界

在全球科技浪潮的澎湃涌动中,人工智能大模型正以前所未有的速度重塑世界。在此过程中,资料显示,微美全息(WIMI.US)作为AI领域的创新代表,围绕开源生态、多模态技术、算力基础设施及垂直场景应用展开深度布局,不断突破AI技术边界并拓宽产业生态。

从介绍来看,微美全息通过开放模型代码、算力接口及技术工具链,构建覆盖云端与边缘端的「全息云」平台,支持开发者调用DeepSeek等通用大模型进行二次开发,加速垂类模型应用的商业化验证。

与此同时,微美全息加速大模型在应用场景的落地速度,该企业陆续披露了旗下较成熟的AI生态图景,覆盖在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地,为AI大模型应用注入强劲动力,正悄然化身成为这场大模型变革背后的关键“燃料舱”。

结尾

人工智能大模型技术作为一项变革性技术,大模型孕育“大发展”,其重要突破之一在于表现出“涌现能力”——当模型参数量不断累加至10b数量级后(b代表十亿数量级),其性能(如通识能力、科学推理能力、生成能力等)呈现非线性增长。那么,不妨期待接下去市面出现更多有影响力、赋能千行百业的大模型,激发行业动力、产业潜力。

 

编 辑:T01
飞象网版权及免责声明:
1.本网刊载内容,凡注明来源为“飞象网”和“飞象原创”皆属飞象网版权所有,未经允许禁止转载、摘编及镜像,违者必究。对于经过授权可以转载,请必须保持转载文章、图像、音视频的完整性,并完整标注作者信息和飞象网来源。
2.凡注明“来源:XXXX”的作品,均转载自其它媒体,在于传播更多行业信息,并不代表本网赞同其观点和对其真实性负责。
3.如因作品内容、版权和其它问题,请在相关作品刊发之日起30日内与本网联系,我们将第一时间予以处理。
本站联系电话为86-010-87765777,邮件后缀为cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
推荐阅读

精彩视频

精彩专题

关于我们广告报价联系我们隐私声明本站地图

CCTIME飞象网 CopyRight © 2007-2025 By CCTIME.COM

京ICP备08004280号-1 电信与信息服务业务经营许可证080234号 京公网安备110105000771号

公司名称: 北京飞象互动文化传媒有限公司

未经书面许可,禁止转载、摘编、复制、镜像