在杂乱中发现对象

一个新的麻省理工学院开发的技术使机器人能够快速识别隐藏在数据的三维云中的对象,让人想起某些人在恰到好处观察它的情况下,有些人可以理解了密集的“魔法眼”形象。

机器人通常通过收集和将视觉场景分解为点矩阵的传感器“查看”它们的环境。想象世界的世界,“矩阵”,除了虚构角色Neo看到的1S和0S被点替换为大量点 - 其模式和密度概述特定场景中的对象。

尝试从这种点云或点云中挑出对象的传统技术可以通过速度或准确度来实现,但不是两者。

通过新的技术,研究人员表示,机器人可以准确地拾取诸如小动物的物体,其在接收视觉数据的几秒钟内以不同的云点掩盖。该团队表示,该技术可用于改进机器感知必须迅速和准确的主机,包括工厂和家庭的无人驾驶汽车和机器人助手。

“这项工作的令人惊讶的是,如果我要求你在这云中找到一个兔子,你就无法做到这一点,”航空航天和航天助理教授和麻省理工学院实验室成员卢卡卡隆说用于信息和决策系统(盖子)。 “但是我们的算法能够通过所有这些杂波看到对象。因此,我们在本地化对象中达到了一定程度的超人表现。“

Carlone and Grantuber Heng Yang将于本月晚些时候在机器人学后提出技术的细节:德国科学和系统会议。

“在不知道的情况下失败”

机器人目前尝试通过比较模板对象 - 一个对象的三维点表示,例如兔子的三维点表示,以兔子 - 具有可能包含该对象的真实世界的点云表示来识别点云中的对象。模板图像包括“特征”或指示该物体的特征曲率或角度的点的集合,如兔子的耳朵或尾巴。现有算法首先从真实寿命点云提取类似的特征,然后尝试匹配这些功能和模板的功能,并最终旋转并将功能与模板对齐以确定点云是否包含有问题的对象。

但是将流入机器人的传感器的点云数据总是包括错误的误差,以错误的位置或不正确的间隔,这可以显着混淆特征提取和匹配的过程。因此,机器人可以做出大量的错误协会,或者研究人员在点云之间称之为“异常值”,并最终将物体定义或完全错过它们。

Carlone表示,一旦功能匹配,最先进的算法能够筛选出良好的糟糕关联,但它们在“指数时间”中这样做,这甚至是一群加工重型计算机,筛选致密点云数据与现有算法,将无法在合理的时间内解决问题。这种技术虽然准确,但用于分析包含密集点云的更大的现实实际数据集是不切实际的。

可以快速识别功能和关联的其他算法速溶,在此过程中创建了大量的异常值或误差,而不知道这些错误。

“如果这是在自动驾驶汽车或任何安全关键应用程序上运行,那就太可怕了,”卡莱尔说。 “在不知道你失败的情况下失败是算法可以做的最糟糕的事情。”

轻松的观点

杨和卡隆代替设计了一种在“多项式时间”中剪发了异常的技术,这意味着它可以这么快,即使对于越来越密集的点云。因此,该技术可以快速准确地识别隐藏在杂乱场景中的物体。

在杂乱中发现对象

MIT开发的技术快速且平滑地将对象与隐藏在密集点云(左)中的物体相匹配,而不是产生不正确,脱节匹配的现有技术(右)。 GIF:由研究人员提供

研究人员首先使用了传统的技术来从点云中提取模板对象的特征。然后,它们开发了一个三步的过程,以匹配与模板对象的点云中对象的大小,位置和方向,同时从错误的功能关联识别好的情况。

该团队为修剪异常值开发了“自适应投票方案”算法,并匹配对象的尺寸和位置。对于大小,算法使模板和点云特征之间的关联,然后比较模板中的特征与点云中的对应特征之间的相对距离。如果说,点云中的两个特征之间的距离是模板中对应点的五倍,则该算法将“投票”分配给对象的假设,即对象比模板对象大的五倍。

该算法为每个功能关联执行此操作。然后,该算法选择与最大的投票下的大小假设下降的那些关联,并将那些识别为正确的关联,同时修剪离开其他选项。以这种方式,该技术同时揭示了这些关联表示的对象的正确关联和相对大小。相同的过程用于确定对象的位置。

研究人员开发了一种单独的旋转算法,它找到了三维空间中模板对象的方向。

这样做是一个令人难以置信的棘手的计算任务。想象一下拿着一个杯子,试图倾斜它,以匹配一个可能是同一个杯子的东西的模糊图像。您可以倾向于杯子的任何角度,并且这些角度中的每一个都具有匹配模糊图像的某种可能性。

现有技术通过考虑对象的每个可能的倾斜或旋转作为“成本”来处理这个问题 - 成本越低,旋转的可能性越多于特征之间的准确匹配。每个旋转和相关成本在各种地形图中表示,由多个山丘和山谷组成,较低的高度与较低的成本相关联。

但卡隆表示这可以很容易混淆算法,特别是如果有多个谷物,并且没有可辨别的最低点,则表示对象的特定旋转和点云中的特定旋转之间的真实旋转之间的真实匹配。相反,该团队开发了一种“凸弛放宽”算法,简化了地形图,其中一个单个谷表示最佳旋转。以这种方式,该算法能够快速识别定义点云中定义对象方向的旋转。

通过他们的方法,该团队能够快速准确地识别三个不同的物体 - 兔子,龙和佛 - 隐藏在增加密度的点云中。它们还能够识别现实生活场景中的物体,包括起居室,其中算法迅速地发现麦片盒和棒球帽。

Carlone表示,由于该方法能够在“多项式时”中,它可以很容易地扩大到分析甚至更密集的点云,类似于无驱动汽车传感器数据的复杂性。

“导航,协同制造,国内机器人,搜救和救援,以及自动驾驶汽车是我们希望产生影响的地方,”卡莱尔说。

该研究部分由军队研究实验室,海军研究办公室和谷歌白日梦研究计划提供支持。



本新闻稿中的材料来自于始发的研究组织。可以为样式和长度编辑内容。有一个问题? 让我们知道.

订阅

每天早上有一封电子邮件,我们的最新帖子。从医学研究到空间新闻。环境的环境。技术物理学。

感谢您的订阅。

出问题了。