京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 3386|回复: 0

OpenAI新突破!机器手自学单手解魔方,模拟训练“上千年”

[复制链接]

12

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-10-18 23:45:55 | 显示全部楼层 |阅读模式 来自 中国
看点:OpenAI让“机器人自主学习完成非特定的真实任务”成为可能。/ ~4 }' J7 E5 V9 o1 q/ n) k* |$ f) q
4 N' z2 w$ v) a2 x2 Y: q3 M" [
1 V( z0 }# r5 l2 P; m( i: @" I: ?  h
" w$ M/ ^$ D2 g7 }$ }; H
$ d: F& l5 g1 k" w* [
智东西10月18日消息,解决鲁比克魔方一直是一件让世界各国挑战者为之疯狂的爱好,而蒙眼或者单手解魔方更是令其中的头号玩家们津津乐道的。近日据外媒报道,美国通用人工智能研究组织OpenAI推出了新款Dactyl机械手,集最新的AI算法于一身,通过机器自主学习,实现了“类人”机器人单手解魔方,代表着OpenAI在构建通用型自主学习机器人领域,又迈出了新的一步。3 `6 t% O: L. A
▲Dactyl解决魔方的快放视频

" Q/ W* ?1 @6 L, ~/ R1 S野心勃勃:一双全能的手
% V7 G& c$ ^8 t4 ]% W: ~' e

! l3 M0 |0 e* K# G' Z& Z5 a- v2 W* v' O' M* [) M6 _7 e
2015年,44岁的Elon Musk,与Greg Brockman、首席科学家Ilya Sutskever、Y Combinator前CEO Sam Altman和天使投资人Peter Thiel共同创立了OpenAI。以研究高度自主且具有通用性质的人工智能系统作为长久以来的追求目标。此次推出的Dactyl是OpenAI去年开始研发的类人机器人手,目前已经成功解决了单手解决鲁比克魔方的问题。这一壮举的实现,得益于机器人部件灵巧性的提升和自身AI软件的巨大飞跃。总结来说,就是可以利用虚拟模拟(virtual simulations)技术让Dactyl在面对实际挑战之前,进行虚拟演练,并最终完成任务。: w" j1 ^4 i2 f8 r& e$ F! e
▲Dactyl训练解决魔方的视频片段8 g; I" ~' {8 o0 Q
从演示视频中不难看出,Dactyl的动作还是有一些僵硬,并且初期的摸索也需要耗费一些时间,与人类几秒钟内解决魔方的快速熟练动作相比,它的动作明显要慢且少。尽管如此,对于OpenAI而言,Dactyl的成就还是让他们离AI和机器人行业所追求的目标更近了一步:可以通过自身学习解决实际问题,而不需要数月数年的训练和专门的编程。目前可以解决魔方的机器人非常多,例如2016年英飞凌(Infineon)开发的机器人可以用不到1秒的时间完成,2018年麻省理工学院研发的机器人可以在0.4秒内解决一个魔方,但它们都有一个共同的特点,就是专门为这项任务而设计,它们是无法完成其他不同任务的。这就是OpenAI的野心所在,它们希望可以构建一种通用型机器人,可以完成更多更广范围的任务,就像人的手,可以做各种各样的工作。

6 T8 T% y1 _6 P; @) _像孩子一样学习  Y* y, _( R8 o3 l+ i  b
+ o7 s8 E0 i: q" @1 a0 n
8 F% y# E- ?$ ]' d2 G; w
Dactyl可能并不会像那些专业解魔方机器人那样迅速的解决一个立方体,就如同大家所看到的那样,他的动作比较缓慢。因为Dactyl的AI软件并不是为了解决魔方而特意设计的。也就是说不是为了在某个特定任务中取得优异结果而设计的。如果仅为了单一任务,只需要更强的机器人和更好的算法程序,甚至在没有人工智能的情况下也可以完成。; e: k* t, Y0 C2 q4 T; b: X& B2 i5 W
▲Dactyl握住鲁比克魔方与这样的机器人不同,Dactyl是一种自学式的机器人手,可以像人类一样处理新任务。它使用软件进行培训,这个软件,用一种非常基础的方式,尝试模拟数百万年来的生物进化过程,就像小孩学习如何使用自己的双手一样。OpenAI希望有一天可以研制出我们只能在科幻小说中读到的那种机器人。这种机器人可以安全地在社会中运行而不会危害我们,并且可以在城市街道和工厂车间等混乱的环境中执行各种任务。
# e& R4 \3 I* s% x6 R! k' s& w
用虚拟代替真实+ {5 x6 u* _" d$ N4 o

) R$ Z( H+ l6 k- B4 A1 X& d2 L% {/ Q
Dactyl使用了最新的AI算法,一种基于激励(incentive-based)的深度学习,也被称作强化学习(reinforcement learning),去帮助它来自行解决问题,这种算法也被用于Dota2机器人,这个机器人在前不久刚刚战胜了世界排名第一的人类Dota2战队。但是玩游戏这种虚拟任务要比真实的任务容易的多,因为在虚拟世界中可以通过超级强大的CPU和GPU让AI在真实世界中花费几周几年时间来完成“数万年”的培训,从而强化自身。而这种方式,移植到实体机器人执行实际任务上,就是不可行的。这就是为什么OpenAI试图用模拟环境(simulated environments)代替真实世界,而这种方式在机器人培训领域可以说是前所未有的。这样,该软件可以同时在许多不同的计算机上加速练习,然后在软件真实控制机器人执行任务时应用这些训练成果。5 ^8 b7 u7 a. \# x# X
▲Dactly的训练场景之一
6 g  A5 ]+ Q' B3 |, [
未来9 C. G3 V; K# ]5 h+ d9 j
& F. O( E+ M9 ^% b, r4 i( K9 I2 G5 t

8 ~) q4 l, l7 l' V9 J. b9 C  t机器人可以像人类一样对真实世界进行建模,并靠着对世界的直觉理解来完成从开门到煎蛋的一切工作。这是未来AI发展的目标。目前,OpenAI只是试图模仿人手这个身体部分,尽量去还原它的复杂性,并让它自然地运转。所以Dactly的机器人手是24关节的仿人设计。而让Dactly以人类方式利用这些关节,OpenAI已经通过软件对其进行了“数千年”的模拟训练。
4 J1 N8 `2 L  R6 Y, H& v▲Dactly关节训练片段“人类是通过几百万年的进化,才拥有了现在的双手”OpenAI表示,对于将来有一天可以执行体力劳动或者家务的这类机器人来说,Dactly只是一小步,但也是至关重要的一步。将来它们甚至可以与人类一起工作,而不是独自孤独的在你家地下室昏暗的灯光下默默工作。同时你不需要去设置繁琐的程序来控制它们的动作。谈到对未来的愿景时,OpenAI表示,机器人学习新任务并适应不断变化环境的能力将与AI的灵活性和机械的可靠性一样重要。Dactly仿佛为我们打开了一扇窗,让解决纷繁复杂世界的问题不在是遥远的梦想。
% S3 G. b, n8 I2 g) ?* g
结语:这是OpenAI的一小步,是类人机器人发展的一大步
+ n5 o; w# N. z7 T
; H  o& V! J7 P, [

+ U# Z7 x4 L0 k) T" c通过强大的AI算法和独创的机器人训练方式,OpenAI不仅实现了机器人单手解决魔方,更是让“机器人完成非特定的真实任务”成为了可能。使机器人初步拥有了学习新任务并适应不断变化环境的能力,向通用型自主学习更近一步。像Dactly这种类人机器人的研发,是需要雄厚的资金与强大的技术成果来推动的,而现在这些潜心致力于尖端技术突破的科技组织或企业不断让我们看到新的希望,在不久的将来,“剪刀手爱德华”或许不会仅仅停留在电影中了。文章来源:Theverge
(本账号系网易新闻·网易号“各有态度”签约帐号)

: R& e6 _5 {' C+ d4 N; v0 y3 ?
* D# A8 U+ Y7 }0 F, ]2 h/ N! p* o
1 g# M) M" @. i. ^+ W- A
$ ^* U# K% Y2 e% i/ j8 `
- \0 j5 u8 J7 [. T
来源:http://mp.weixin.qq.com/s?src=11&timestamp=1571410805&ver=1920&signature=hnv3o0L17IRuClYifMubWlYsqLJU5VUszNwZPzw8Hi0oWJ1wQI36jQnIaELyudX3hkK*cvTRf0WAVsImMlQG3HBoKlGvPaD9qd2wN6qbFz429DRBWHEUhtXQjDd2NOyg&new=1' }2 X: m9 S' t, ^4 y, p
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-7-4 01:52 , Processed in 0.051949 second(s), 28 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表