阿里AI获ICCV 2019世界冠军，视觉识别从“一图一物”升级到“一图多物” -- 飞象网

　　10月28日消息，在计算机视觉领域顶级会议ICCV 2019上，阿里AI从全球17支队伍中脱颖而出，赢得COCO挑战赛物体检测项目冠军。

　　ICCV(International Conference on Computer Vision)是计算机视觉领域顶级会议，由美国电气和电子工程师学会(IEEE)主办，在全世界范围内每两年举办一届。

　　大会重头挑战赛COCO(Common Objects in Context)在业内负有盛名，被科技企业、科研机构和高校视作衡量计算机视觉技术的标杆。阿里巴巴达摩院机器智能实验室团队参加的是挑战赛的物体检测(Detection)项目。

　　比赛要求参赛者从测试图片中检测物体的位置，识别物体的类目，对物体轮廓作出像素级分割。该数据集涵盖真实场景常见的80类、20万张图片、50万个物体。达摩院团队在不使用额外数据的情况下获得第一。

　　▲ 利用知晓尺度的模型推理，阿里AI能够更好地识别极端尺度物体

　　达摩院的算法实现了多项技术创新，比如更丰富的检测特征提取、更精准的轮廓衡量指标、知晓尺度的模型推理等。

　　以知晓尺度的模型推理为例，它提高了极端尺度物体的识别准确率。所谓尺度，是指物体在图片中占据的画幅，一只在近景特写中充斥整个画面的蜂鸟，尽管体重只有3克，也是极端大尺度物体;而一头5吨重的大象，因在全景风光照中呈现为远处的一个墨点，就属于极端小尺度物体。在传统模型下，这两类物体都难以被检测分割。

　　传统模型对不同物体采取平均加权办法，无法检测分割极端尺度物体。达摩院研发的新模型，能够依据物体尺度做不同程度加权并进行有针对性的推理，更好地识别极端尺度物体。

　　达摩院的算法已应用于天猫淘宝的图搜业务拍立淘，使拍立淘的识图水平从“一图一物”升级到“一图多物”。假如用户上传一张包含多个商品的照片，过去拍立淘只能识别一个主要商品，现在则可以一次识别多个商品，并把对应商品自动检测分割展现给用户。

　　新功能上线一月以来，已经服务约30%的图搜用户，平均每天识别几千万张图片。