雷锋网AI研习社讯:物体姿态估计在机器人领域(如机械臂抓取),AR/VR领域,无人驾驶领域有着广泛的应用,在物体跟踪,建模等相关领域也有着重要的影响。任务提供物体三维模型和一张RGB(D)图像,要求精确估计该物体在图像中的位置。虽然RGB相机有着广视角,高分辨率,可以室外工作等一系列优点,可是由于缺少强大的基于RGB图像的姿态优化方法,基于RGB图像的在该任务上的精度远低于基于RGB-D图像的方法。本工作提出了一个解决方案,能大幅度提升RGB图像上物体姿态估计的精度,多个指标追平乃至超越基于RGB-D图像的方法的结果。


分享主题

DeepIM: 基于单张RGB图像的物体姿态估计


分享嘉宾

李益,华盛顿大学博士生,本科硕士毕业于清华大学,COCO2016冠军,R-FCN, FCIS, Deformable-Conv作者。

 

分享提纲

1. 任务背景介绍:什么是物体姿态估计,以及为什么要在RGB图像上做

2. 网络整体框架:迭代更新估计结果并重新预测残差

3. 关键点:如何设计合理的representation来表示预测结果

4. ablation study & results:各个设计的原因和思考,和其他方法的比较

5. 扩展探究:在没见过的物体上也能有效


分享时间

北京时间 11 月 07 日(周三) 15:00

错过直播不要紧,回放视频上传后也能看哦~


直播链接

http://www.mooc.ai/open/course/592

今天15点大讲堂 | DeepIM: 基于单张RGB图像的物体姿态估计


想了解更多雷锋网 AI 研习社直播?

欢迎移步雷锋网 AI 研习社社区~