正文内容 评论(0)
6月28日,计算机视觉领域顶级会议CVPR 2021竞赛结果已全部揭晓,阿里巴巴视觉算法团队成绩领跑全球,共斩获16项世界冠军,覆盖图像及视频内容理解、遥感影像分析、视觉问答等场景,多项研究可帮助盲人感知物理世界、识别农业领域灾害等。
CVPR是AI领域最顶级的学术会议之一,会议每年都会吸引全球顶级高校及Google、微软、Facebook等科技企业参加,近几年,该会议的主题逐渐从单纯的学术交流延伸至学术与应用结合的探索,而中国企业也迎来了高光时刻,在论文数量级竞赛冠军数上均有不俗表现。
据悉,阿里巴巴达摩院视觉实验室、手淘算法等团队此次参与了多项高难度视觉任务竞赛,最终在16项竞赛中击败国内外科技公司及高校,斩获16项世界冠军。
AI基于视频生成前后连贯的句子描述
在ActivityNet Dense Video Captioning竞赛中,参赛团队算法需要基于一段视频生成前后连贯的句子描述,以帮助盲人理解视频内容。在该竞赛中,达摩院创新性采用SOTA视频网络及多模态特征融合,同时解决了事件序列描述的问题,可高效AI理解视频内容,最终以METEOR score 10.33的成绩获得第一名。在另外两项竞赛中,达摩院AI算法还准确识别了盲人拍摄的低清晰度照片,帮助盲人看清图片内容。
达摩院AI Earth精准识别农作物生长过程中的干旱、洪涝等农业灾害
视觉技术在农业场景的探索是近两年的热门话题,在本届CVPR中,达摩院包揽了AGRICULTURE-VISION CHALLENGE监督和半监督两大赛道冠军。竞赛需要参赛团队基于遥感航拍影像来识别农业灾害,例如农作物生长过程中的干旱、洪涝等农业灾害类型。达摩院AI Earth采用了对抗学习、颜色语义引导、域归一化和双表征网络等方法,有效解决弱纹理、样本不平衡、颜色敏感、跨域等难题。未来,该算法可应用于精准农业、农业资产盘点、农业灾害定损等领域。
视频行为理解是一直都被认为是一项非常具有挑战性的任务,达摩院针对该问题研发了技术框架EMC2,解决了视频背景复杂、视频人物相互遮挡及视频分辨率不足等干扰问题,最终在ActivityNet、AVA-Kinetics、Epic-Kitchens、HACS等视频理解竞赛中获得5项冠军。据介绍,该技术体系已在视频搜索、版权保护、视频交互等场景使用。
基于达摩院EMC2技术体系的算法斩获5项冠军
达摩院参赛团队表示,“计算机视觉领域的研究热点每年都在变化,AI算法需要面临的任务场景也越来越复杂,单纯的算法创新很难在实际问题中有好的表现,我们的算法融合了多项创新技术,并且在视频会议、农业、电商等领域大规模使用。”
据介绍,达摩院在CVPR期间还主办了第二届大规模商品图像识别竞赛,最终共有623支队伍报名注册,冠军模型识别准确率超去年10%。
本文收录在
#阿里巴巴
- 热门文章
- 换一波
- 好物推荐
- 换一波
- 关注我们
-
微博:快科技官方
快科技官方微博 -
今日头条:快科技
带来硬件软件、手机数码最快资讯! -
抖音:kkjcn
科技快讯、手机开箱、产品体验、应用推荐...