云顶娱乐 > 科技技术 > 云顶娱乐MIT新AI系统成精了,扫一眼就能知道物体

原标题:云顶娱乐MIT新AI系统成精了,扫一眼就能知道物体

浏览次数:149 时间:2019-08-19

原标题:瞄准工业智能化市场,麻省理工让 AI 教机器人操纵物品

原标题:有了这项新技术机器人可就真的成精啦!

智东西

人工智能正在一步步走向强大。今天,麻省理工学院又公布了一项新发明,让科技更进一步。

来自engadget的消息称,麻省理工学院最新研究发布的的机器视觉系统可以让机器人自行解决它所看到的问题。

编 | 赵佳蕊

云顶集团官网,麻省理工学院计算机科学与人工智能实验室(CSAIL)的研究人员,发明了一种名为 DON 的“密集的视觉对象网”——让机器人能学会独立观察、理解并操作它们从未见过的物体。

www.4008.com,对于反复执行特定动作的机器来说,目前的计算机视觉技术已经足够了,比如从装配线上取下一个物体,把它放到一个箱子里。然而,要让机器人变得足够有用,不仅能在仓库里装箱子,还能在我们自己的家里帮上忙,目前的而技术就显得力不从心了。

导语:美国麻省理工学院计算机科学和人工智能实验室研究人员设计了一个可以把触觉信号转化为视觉信号的的人工智能系统,也可以根据视觉片段预测触觉。

研究人员们计划今年10月在瑞士的机器学习大会上展示他们的新发明。

对此,麻省理工学院设计了“DON”系统。

智东西6月17日消息,近日麻省理工学院计算机科学和人工智能实验室的研究人员研发出了一个新的人工智能系统,这个人工智能系统能够通过触觉信息生成视觉信息,也可以根据视觉片段预测触觉。

云顶娱乐 1

DON,或称“密集物体网”,是麻省理工学院计算机科学和人工智能实验室(CSAIL)开发的一种新型机器视觉形式。它能够生成一个“可视化路线图”——即以坐标形式排列的可视化数据点的集合。这个系统会把这些单独的坐标集拼接成一个更大的坐标集合,就像您的手机可以将多张照片拼接成一个全景图像一样。这使得系统能够更好、更直观地理解对象的形状以及它在周围环境中的工作方式。

相关论文将在下周的计算机视觉和模式识别会议上将发表一篇新的论文,这篇论文由CSAIL博士生Yun Zhu Li、MIT教授Russ Tedrake、Antonio Torralba和MIT博士后Jun Yan Zhu共同创作。 一、这个AI可以将视觉信息和触觉信息相互进行转换

DON试图抓起一只鞋子(图片来源:MIT CSAIL)

云顶娱乐,“从计算机视觉系统中得到的最粗糙、最高级的东西就是检测目标,”该研究论文的作者、博士生Lucas Manuelli告诉Engadget。“下一步是进行像素标记,所有的像素都是一个人或一条道路的一部分。很多自我驾驶汽车系统都会进行这两部操作。“

该小组的系统使用了GANs把触觉数据拼凑出视觉图像。其中GANs的神经系统被应用在两个部分,包括产生样本的发生器和能够区分产生样本和真实样本的鉴别器的两部分神经网络。

核心研究人员 Lucas Manuelli 说:“目前的许多科技手法都无法识别物体的准确样貌。例如,现有的算法无法操纵机器手柄来抓一个杯子。尤其是当杯子的形状和摆放复杂时,更为艰难。”

“但如果你真的想以某种特定的方式与某个物体互动,比如以特定的方式抓住鞋子或抓住一个杯子,”他继续说道,“那么仅仅有一个边界框或所有对应于杯子的像素是不够的。我们的系统必须得在对象中获得更精细的细节......这种信息对于进行更高级的操作任务是必要的。“

样本的获取来源于一个名为visgel的数据集,visgel拥有超过300万个视觉/触觉数据对,其中包括12000个视频剪辑,剪辑中包含了近200个物体(如工具、织物和家用产品)。

DON 不是一个控制系统。相反,它是一种自我监督的深层神经网络——一种模仿大脑神经元功能的分层算法——训练机器人用精确坐标的形式来描述物体。在训练结束后,DON 能够自主地挑选出参考框架。当一个类似的新物体出现时,DON 就可以将它们映射到一起,在三维空间中计算出物体的可视化形状。

也就是说,DON系统可以让机器人看着一杯咖啡时,正确定位到咖啡杯的手柄上。当机器人拿起咖啡杯时,DON系统能让机器人意识到杯子的底部需要保持指向下方,以避免杯子里的东西洒出来。

这一人工智能系统首先将识别机器人所接触物体区域的形状和材质,并在参考的数据集中进行比对,最终生成所接触部位的图像信息。

云顶娱乐 2

云顶娱乐 3

例如:如果给出鞋子上完整的触觉数据,这个模型就可以确定鞋子上最有可能被触摸的位置。

DON的视角(图片来源:MIT CSAIL)

更重要的是,该系统将允许机器人从一堆相似的物体中挑选出特定的物体。

云顶娱乐 4

根据研究人员所说,不论是硬的物体(如帽子)还是软的物体(如毛绒玩具),DON 都只需要20分钟就可以完成学习。DON 可以识别各种各样的物品,包括适度变形的物品以及质感非常轻薄的物品。

“许多操纵方法无法让机器人在不同的方向上识别出物体的特定部分,”Manuelli在研究中写道,“例如,现有的算法无法通过手柄抓住马克杯,特别是当马克杯朝着不同的方向时。”

▲运行流程

此外,DON 并不会分辨物体的颜色和纹理,这使得它在使用 RGB 或深度数据上更有优势。因为只要一点轻微变形,颜色和纹理就会改变,不具备“可抓取”的特性。

该系统依赖于拥有RGB深度相机组合的RGB-D传感器。并且,这个系统可以进行自我训练——如果你想让系统识别棕色的靴子,你只需把机器人放在一个有棕色靴子的房间里,然后这个系统将自动循环启动,获取用于生成坐标点的参考照片,然后根据所看到的内容进行自我训练。整个过程不到一个小时。

数据集中参考照片有助于对环境的详细信息进行编码,从而使机器学习模型能够自我改进。在这个研究中,他们在库卡机器人手臂上安装了一个触觉式凝胶视觉传感器,这个传感器由麻省理工学院的另一个小组设计,可以将当前的图像与参考图像进行比较,以确定触摸的位置和比例。 二、这个系统可以帮助机器人进行自我学习

“在工厂里,机器人通常需要十分复杂的部件才可以工作,”Manuelli 说,“但是像 DON 这样的系统就能省去这些复杂部件。只需拍一张照片,就能掌握和操纵物体。”

云顶娱乐 5

“通过观察这个场景,我们的模型可以想象到触摸到一个平坦的表面或锋利的边缘的感觉。”CSAIL博士生 Yun Zhu Li说。

云顶娱乐 6

“在工厂中,机器人通常需要复杂的零件才能可靠地工作,”Manuelli写道,“但像这样一个能够理解物体方向的系统,只需拍张照片,就能相应地把握和调整物体。”

“在黑暗中进行接触的时候,仅从触觉上,我们的人工智能模型就可以预测与环境的交互作用,把视觉和触觉这两种感觉结合在一起就可以强化机器人的能力,减少我们在处理和抓取物体的任务中可能需要的数据。”

DON正在抓取一只杯子(图片来源:Tom Buehler / MIT CSAIL)

这项技术仍然处于起步阶段,Manuelli希望在不断完善后,能够应用到家庭的日常机器中,帮助人们更好地生活。

云顶娱乐 7

团队认为 DON 可以应用在工业环境中,例如用作仓库机器人。同时,团队希望开发一个更有能力的版本,让机器人可以对物体进行“更深入的理解”。

【更多人工智能资讯欢迎关注微信公众号“AI锐见”(Rebuild_ai)】返回搜狐,查看更多

▲模型从触觉生成视觉的过程

研究人员写道:“我们认为,DON 是一种新颖的物体表现形式,可以衍生出使许多全新的机器人操作方法。”

责任编辑:

研究人员注意到,当前的数据集只有在受控环境中交互的例子,但是其中一些细节,比如物体的颜色和柔软度,仍然难以被系统推断出来。

在这个领域,国内也有很多公司在做类似的事,例如梅卡曼德、阿丘、库柏特等等。这些公司都在瞄准工业智能化市场,为工业机器人赋予视觉与触觉双重感知能力。返回搜狐,查看更多

不过,他们说,他们的方法可以在生产环境中为集成人类机器人无缝衔接地打下基础,尤其是在缺少视觉数据的任务上。比如:当灯熄灭或工人必须盲目地接触容器时。

责任编辑:

对于这一项研究,加州大学伯克利分校的博士后研究员安德鲁·欧文斯说:“在视觉和触摸信号之间进行转换方面,这是第一种非常令人信服的方法。像这样的方法对机器人学习很有用。”

他还表示:有些问题对于机器人来说是很难的,比如:你可以问这个机器人“如果我选择通过握住杯子把手提起这个杯子,我的握法会有多好?这是一个非常具有挑战性的问题,因为信号非常不同,这个模型已经能够证明它是非常有效的。”

本文由云顶娱乐发布于科技技术,转载请注明出处:云顶娱乐MIT新AI系统成精了,扫一眼就能知道物体

关键词: 云顶娱乐

上一篇:小米8青春版19日发布!官方宣传图这些细节透露

下一篇:没有了