10月28日消息,在计算机视觉领域顶级会议ICCV 2019上,阿里AI从全球17支队伍中脱颖而出,赢得COCO挑战赛物体检测项目冠军。
ICCV(International Conference on Computer Vision)是计算机视觉领域顶级会议,由美国电气和电子工程师学会(IEEE)主办,在全世界范围内每两年举办一届。
大会重头挑战赛COCO(Common Objects in Context)在业内负有盛名,被科技企业、科研机构和高校视作衡量计算机视觉技术的标杆。阿里巴巴达摩院机器智能实验室团队参加的是挑战赛的物体检测(Detection)项目。
比赛要求参赛者从测试图片中检测物体的位置,识别物体的类目,对物体轮廓作出像素级分割。该数据集涵盖真实场景常见的80类、20万张图片、50万个物体。达摩院团队在不使用额外数据的情况下获得第一。
▲ 利用知晓尺度的模型推理,阿里AI能够更好地识别极端尺度物体
达摩院的算法实现了多项技术创新,比如更丰富的检测特征提取、更精准的轮廓衡量指标、知晓尺度的模型推理等。
以知晓尺度的模型推理为例,它提高了极端尺度物体的识别准确率。所谓尺度,是指物体在图片中占据的画幅,一只在近景特写中充斥整个画面的蜂鸟,尽管体重只有3克,也是极端大尺度物体;而一头5吨重的大象,因在全景风光照中呈现为远处的一个墨点,就属于极端小尺度物体。在传统模型下,这两类物体都难以被检测分割。
传统模型对不同物体采取平均加权办法,无法检测分割极端尺度物体。达摩院研发的新模型,能够依据物体尺度做不同程度加权并进行有针对性的推理,更好地识别极端尺度物体。
达摩院的算法已应用于天猫淘宝的图搜业务拍立淘,使拍立淘的识图水平从“一图一物”升级到“一图多物”。假如用户上传一张包含多个商品的照片,过去拍立淘只能识别一个主要商品,现在则可以一次识别多个商品,并把对应商品自动检测分割展现给用户。
新功能上线一月以来,已经服务约30%的图搜用户,平均每天识别几千万张图片。