首页|必读|视频|专访|运营|制造|监管|大数据|物联网|量子|元宇宙|博客|特约记者
手机|互联网|IT|5G|光通信|人工智能|云计算|芯片报告|智慧城市|移动互联网|会展
首页 >> 移动互联网旧 >> 正文

百度世界详解三维视觉:从看清、看懂到看透,AI深度量化我们的世界

2018年11月2日 18:56  CCTIME飞象网  

  每个人都用一双眼睛观看世界。如果闭上一只眼睛,你的左手食指和右手食指同时相对伸出,都难以“相遇”。如果睁开双眼,这个任务就变得非常简单。这是百度三维视觉首席科学家杨睿刚在百度大脑论坛上给大家分享的小实验。“实际上,这是人类通过一双眼睛以三维视觉对周围的环境进行精确的定位,今天我想跟大家分享的就是如何让机器也能够拥有像人类一样观察世界的能力。”他表示。

图片6.png

  无论是人还是机器,三维视觉都是他们了解世界的重要途径。现场,杨睿刚介绍了百度视觉技术的开放进展,并详细解读了三维视觉解决方案及其应用案例。他表示,百度视觉技术继从看清到看懂后再次实现了新突破——看透。基于百度三维视觉技术,机器可以像人一样看透世界,从而更好地在AR、新零售、工程机械等领域施展才能。

  距今年7月百度大脑3.0版本发布,开放视觉语义化仅4个月,百度视觉语义化技术平台开放再次重磅升级。

  杨睿刚介绍,在底层依赖上,百度研发了适用于三维视觉的立体视觉AI传感器。硬件层面,立体视觉AI传感器采用了三维AI视觉模组,成本大大降低。而且传感器通过端上运算缩减了99%云端传输量,效率也进一步提升。软件层面,百度针对立体视觉开发了从实时端上运算到大规模云端分布式计算等多种算法,其中一些算法在国际公开数据集排行榜KITTI-Stereo上包揽了第一、二名。

  在图片分析上,百度将三维视觉应用在人脸识别上,从而使活体识别正确率从95.26%提升至99.55%。此外,百度三维视觉技术还通过整合场景分类、图像分割、SLAM等核心能力创新打造了智能化场景的感知能力。而且百度三维视觉将这些能力集成到了移动端上,为手机端的AR特效提供了技术保障。

  在视频分析上,通过引入多角度视频的标定,三维视觉技术促使人体检测和跟踪准确率达到了95%以上。

  基于在底层依赖、图片分析和视频分析等技术上的突破,百度升级了可视化展现、机器人SDK、新零售和工程机械的解决方案。

  AR是当前最热门的交互方式。百度推出的可视化展示产品方案DuMix AR 3.0结合了人脸特效、美化特效、环境特效和人体特效等20多项AR能力,为用户和开发者提供了丰富的交互体验。不仅如此,借助这些开放基础能力和相互叠加的组合玩法还能形成一套完整的AR视频解决方案。

  AR视频解决方案涵盖四大技术应用方向的全面能力矩阵、整合百度AI+AR多重能力、更加易用的平台工具和完善的服务体系,为开发者与行业合作伙伴提供了高效、低成本的内容制作服务;同时结合百度强大分发优势,助力合作伙伴实现业务创新、创造巨大的用户价值。目前,百度AR视频特效解决方案已经陆续与全民小视频、百度贴吧、好看视频等多个垂直内容合作伙伴开展探索合作,将持续推动AR视频制作成为AR技术应用的又一常态化新场景,吸引越来越多的优质内容生产者加入百度AR生态。

  除了听和看的能力,机器人最重要的还有行走能力。当前机器人动作能力非常有限,大部分机器人都是固定不动,一些机器人能在静态环境中运动,而在复杂环境中机器人行动就会非常缓慢。针对这些情况,百度动态复杂环境下新导航算法可以创建仿真环境,并让机器人在这个仿真的环境中做各种各样行走的尝试,并从中找到一个最优的路径。即使在人流密集的商场里,基于该算法的机器人也能轻松行走,这背后的算法与Alpha Go是一样的。

  在日常应用中,百度融合视觉语义化与AR等能力打造出全新的AI零售解决方案。这套方案通过人流抓拍会员管理、客流计数、人流动线与热力图统计,能够提高客户转化率,提升整体收益,实现更便捷地管理,同时还能通过分析获取数据结构,为商家提供策略指导。据悉,百度与海信合作打造的AI零售体验店随后将会面向公众开放,为用户提供即拿即走的便捷购物体验。

  除零售外,三维视觉也为工程机械带来了焕然一新的智能化体验。以往常说“挖掘机技术哪家强,中国山东找蓝翔”,不过注入AI的百度无人挖掘机技术可不逊于蓝翔。百度开发的无人挖掘技术方案,是世界上首套基于视觉技术开发的低成本、可量产、适用工程挖掘装备的人工智能解决方案。在工程项目中,无人挖掘机与无人机、自动驾驶工程运载车默契配合,从制作作业方案、精准施工、转运、卸载全流程自主完成,从而可以达到作业与管理的少人化/无人化,降低安全风险,实现设备全天候智能施工,不仅大幅提升了施工效率,而且显著降低人力成本,将助力企业实现收益倍增。

  杨睿刚表示,“百度视觉从最初的单张图片分析开始,进入视频,进入三维,不断地向更高纬度的发展。这都是为了更好地让机器看清、看懂、看透我们的世界,从而更好地为我们服务。”百度视觉还将持续创新,不断突破,为开发者和合作伙伴提供更多的AI技术和解决方案的支持。随着百度AI生态的势能不断增加,越来越多的行业将进入AI变革,也正在给我们带来更智能更便捷的生活。

编 辑:T01
声明:刊载本文目的在于传播更多行业信息,本站只提供参考并不构成任何投资及应用建议。如网站内容涉及作品版权和其它问题,请在30日内与本网联系,我们将在第一时间删除内容。本站联系电话为86-010-87765777,邮件后缀为#cctime.com,冒充本站员工以任何其他联系方式,进行的“内容核实”、“商务联系”等行为,均不能代表本站。本站拥有对此声明的最终解释权。
相关新闻              
 
人物
工信部张云明:大部分国家新划分了中频段6G频谱资源
精彩专题
专题丨“汛”速出动 共筑信息保障堤坝
2023MWC上海世界移动通信大会
中国5G商用四周年
2023年中国国际信息通信展览会
CCTIME推荐
关于我们 | 广告报价 | 联系我们 | 隐私声明 | 本站地图
CCTIME飞象网 CopyRight © 2007-2024 By CCTIME.COM
京ICP备08004280号-1  电信与信息服务业务经营许可证080234号 京公网安备110105000771号
公司名称: 北京飞象互动文化传媒有限公司
未经书面许可,禁止转载、摘编、复制、镜像