京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 8925|回复: 0

OpenAI机械手“自学”完成单手解魔方

[复制链接]

13

主题

0

回帖

10

积分

新手上路

积分
10
发表于 2019-11-11 18:40:06 | 显示全部楼层 |阅读模式 来自 中国
点击  t7 L! A& U  w' P0 e
上方“IEEE电气电子工程师学会”即可订阅公众号。网罗全球科技前沿动态,为科研创业打开脑洞。
$ Q# M3 q; j: x  U
" M( K; k2 T' Q5 C6 o5 X% z8 L# O( U- r4 \

2 W! s1 k& g/ [) O# U1 {
Image: OpenAI

$ [: M, I; W, R0 G3 t- S6 f& ]- D% \- v9 ]/ Z
3 J0 t$ R' g' D  y: V+ f1 o# {/ n
在我(作者,以下简称我)看来,手部操作是一种技能,一般来说,人类不会主动学习。我们只是通过用手指和手做其他更具体的任务来解决问题。这使得教机器人解决手部操作任务变得特别棘手,因为我们是通过实验和反复试验自然获取的。机器人也可以通过尝试和改正错误来学习,但是由于它通常最终都是错误的,所以这需要花费非常长的时间。  R2 ~! n) O) U0 q9 N, g) p* U! A: o: b
 
1 P5 `9 ?3 X$ V6 o去年六月,我们写了关于OpenAI教五指机器人手操纵立方体的方法。OpenAI使用的方法利用了相同的实验和反复试验,但是重点在仿真中,而不是在机器人硬件上。对于需要大量技巧的复杂任务,仿真通常很难转化为现实世界的技能。但是OpenAI通过在训练过程中向仿真引入大量随机性,这样,即使模拟与实际情况不完全匹配(事实并非如此),系统仍然可以处理在实际硬件上遇到的各种变化。9 \! h  B& V0 t' \$ {+ U; _9 r
 % }8 Q1 C) v! c5 V
近日,人工智能研究组织OpenAI在构建通用自学机器人方面取得了新的里程碑。该组织的机器人部门表示,其去年首次开发的类人机器人手Dactyl,已经学会了单手解魔方。OpenAI将这一壮举视为机器人附件灵巧性以及自家AI软件的巨大飞跃,AI软件使Dactyl可以在面临实际挑战之前,利用虚拟仿真学习虚拟任务中的新任务。
0 Q* B; Z5 @/ Y5 x$ ^1 Q 1 @4 H1 ]$ F& H3 w
最初的步骤是将机器人对魔方的操作分解为两个不同的任务:1. 将立方体的一个面朝任意方向旋转90度,然后旋转2度。翻转立方体以将不同的面带到顶部。由于旋转顶面对机器人来说要比旋转其他面简单得多,所以最可靠的策略是做一个90度的翻转,以获得想要在顶面旋转的面。求解立方体的实际过程在计算上是直接的,尽管求解过程是针对机器人可以执行的运动而不是将步数最少的求解优化的。
/ G# t2 @$ f5 P % D. _5 k. K3 `- H  t1 {
进行真实立方体求解的物理设置是一个具有相位空间运动捕捉系统的阴影灵巧E系列手,以及用于视觉姿势预测的RGB相机。被操纵的魔方也相当奇特:它里面塞满了传感器,可以以5度的精度报告每个方位,这是必要的,因为当魔方遇到一些遮挡时,要知道魔方的状态是非常困难的。2 v8 {/ N4 G# d6 T" s
 2 Q, I7 _: n* ?# E- s( ?+ C# y& ]
这套模型具体包括:一款灵巧的人形机械手,一套AI软件模型(用于识别魔方体的最佳移动序列),以及一个魔方操作器(最多可控制五根手指)。该团队报告称,基于模型与无模型的两大规划工具组合之后,该方案在1400次试验中实现了90.3%的平均成功率。而在对AI组件进行30000次操作训练之后,其平均成功率进一步提升至95.2%。. t0 G& i; t2 j' {& O3 t+ o  i
 / J8 Z4 ^; l: V) w: Z. e! n1 l
OpenAI机器人团队技术成员MatthiasPlappert表示,“我们之所以对魔方任务抱有浓厚兴趣,是因为它要求机器手的敏捷性接近于人类水平。从某种意义上讲,这是一项高度复杂的任务,必须真正精确地控制手指,才能准确翻转魔方的各个面。我们希望通过这次实验看看去年发布的这套AI模型能够走多远。”
2 K' H' r7 d. d; _3 k. j( w7 a2 L. ? 
; Q- @, P0 e$ J* T
- e0 F$ I, [6 \3 t
Image: OpenAI

5 F% @# {5 e0 h& z  j" {1 k" {$ {& Y6 h2 }. ~9 R! M3 n
* P$ r, Q# R% ~. u1 R
该团队采用的解决方案是一种被称为「自动域随机化(ADR,automatic domain randomization)」的算法。这种算法会自动生成用于训练强化学习模型的分布以及可通过视觉估计对象姿态的模块,即一个基于视觉的姿态估计器,凭借着由奖励与惩罚机制重复实现的复习与强化学习过程,AI系统将一步步朝着正确的目标完成自主学习。

5 P6 x  m- ]$ L! u: l 
4 Z/ P6 q+ c% P% Q他们的最终目标是实现完全通用,这一点也与OpenAI提出的“在多个领域中建立起「安全」的人类级AI”目标相吻合。大多数专家认为,机器人技术的通用化还有很长的道路要走.4 O2 V1 u4 [& I4 R& k, L( c+ q& T
 
) `% R4 ]. }* P; K2 \( c研究人员表示:“最终,我们希望未来的人工智能可以将某种价值传递到现实当中。以机器人为例,机器人的优势在于帮助人们关注某些事物或者从事一部分高危工作……但实现这些目标的前提,就是机器人必须有能力与现实世界互动。而这,正是我们当下努力的意义。”
5 g8 }" E) H2 f) q5 P/ F( K1 C2 a( b3 ~; I! `* G5 [& ]

  y2 e0 ^* Q! g9 h8 o+ j* J6 a- R) a. K/ E* N2 q& Q
点击
' D, A# L; O- ~阅读原文
3 z1 G) ?$ E7 Q; G( E了解更多详情1 w9 P& n& s% Y7 L+ l' r

5 q) V" O- I. ^- E. ], A2 H# S: s5 K. K$ N) u0 r  R& `( _0 n4 X
4 R2 I0 `7 ?9 Y( N
来源:http://mp.weixin.qq.com/s?src=11&timestamp=1573468204&ver=1968&signature=yz*BW8xdIRF2DCZISAAnD2ATNj95APFESws0E4cCNHBCRwd71mLkVQPGkmO7mIzKGs*14Knc9Xry6Co0m3c*YMsqsiiNxEAvM4Soh7tTtIln0BUVW-LAYbIub6BGW-D1&new=18 F7 v. x% O2 `( ~5 W
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-10-17 00:54 , Processed in 0.045441 second(s), 23 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表