皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

DeepMind 如何重塑机器人的概念

人工智能已经深入我们的生活,虽然你可能难以指出明显的例子。在无数服务的背后,有神经网络在为我们的虚拟助手提供支持、提出在线购物建议、识别出照片中的对象、审查我们的银行交易以避免欺诈活动、转录我们的语音信息,并清除社交媒体上的过激言论。但这些应用都有着共通的局限性,即只能在有限且明确可预测的环境当中学习和起效。

我们的工作与商业环境没这么单纯,所以让 AI 发挥作用自然困难重重。为了更上一层楼,研究人员正努力将 AI 与机器人技术融合起来,希望创造一种真正具备智能,可以在混合、无法预测且残酷无情的现实世界中做出决策、控制物理实体的完整解决方案。这无疑是个革命性的发展目标,也引起世界上众多强大技术研究组织的关注。

Google 位于伦敦的 AI 合作伙伴 DeepMind 机器人技术主管 Raia Hadsell 坦言,“我认为机器人技术领域的发展态势,可能要比计算机视觉技术的当前水平落后十年左右。” 即使对 Google 来说,这也是一项艰难的挑战。其中某些部分相对简单:在大多数机器人应用领域,我们很难收集到能够推动AI其他领域取得进展的庞大数据集。也有些问题深刻而复杂,涉及 AI 领域的老大难挑战:如何让 AI 在不忘记旧任务的前提下学习新任务?如何创建一种 AI,将它在新任务中学习到的技能融合进之前掌握的能力之内? 只要在这些方面取得突破,AI 的应用领域将大大拓宽。我们热切希望 AI 完成的各类目标——驾驶汽车和卡车、在疗养院工作、灾后清理、完成基本家务、建造房屋,播种、培育和收割庄稼等等——这一切超出现有 AI 处理范围的复杂、通用任务,都将可以由机器人独力完成。 除了打开巨大的潜在市场之外,这项工作还将带来直接且深远的社会影响。它不仅启发着我们对机器人技术乃至AI研究的思路,更会影响我们对于智能这一概念本身的理解。 我们不妨从最简单的问题起步。神经网络的水平取决于训练中所使用数据的质量与数量。海量数据集的出现,成为近年来AI技术迅猛发展的前提:图像识别软件需要数百万张经过标 记的图像训练而成;AlphaGo 之所以能在古老的围棋中击败世界第一人,靠的就是数十万轮棋谱数据训练与自我对弈的几百万次磨炼。 但是机器人的训练可没有这么庞大的数据集可供参考。

Hadsell 指出,“这是个非常关键的困境。我们可以在几分钟内通过数百个 CPU 并发运行,让 AI 模型快速模拟成千上万盘围棋对弈。但如果机器人拿起一个杯子需要 3 秒钟,那么每台机器人每分钟最多只能进行 20 次练习。更重要的是,如果图像识别系统在前 100 万张图像中总结出了错误结论,不会有什么大问题。但如果双足机器人在前 1000 次行走中不断跌倒……那没等它学会走路机器就差不多要报废了。” 真实数据的问题目前还没能得到解决,但 DeepMind 从未止住脚步,他们只是不断收集自己能够收集到的一切、机器人则在实验室里嗡嗡作响。而在整个行业内,研究人员则希望通过所谓“模拟到真实”的技术解决数据匮乏问题。 位于旧金山的 OpenAI 实验室最近正在利用这项策略训练机械手,尝试让它学会破解魔方。研究人员开发出一个包含魔方加机械手的虚拟环境,并在其中训练负责操纵机械手的 AI 模型。之后它们把 AI 模型安装在实体机械手上,尝试破解真正的魔方。从结果来看,模拟训练确实能教会物理机器人解决真实世界中的难题。

Hadsell 适时泼了点冷水,表示虽然取得了重大成功,但这项技术仍有很大的局限性。AI 研究员兼机器人专家 Rodney Brooks 有句名言,“模拟注定会成功”,因为模拟环境过于完美、与现实世界的复杂状态脱节。Hadsell 指出,“想象一下模拟环境中有两只机械手臂,不断尝试组装一部手机。”只要让它尝试几百上千万次,机械手最终能够在几秒钟之内以恰到好处的力度加毫厘不差的时机组装出一部手机——每个部件都在最正确的时间落在最正确的位置上。但这样的结果永远无法适用于复杂而且混乱的现实。目前研究人员还无法建立起包含不完美因素的模拟方案。Hadsell 解释道,“我们当然可以人为添加噪声和随机性,但还没有任何一种现代模拟方案能够可靠地重现哪怕一小部分现实条件。”

转自 https://www.solidot.org/story?sid=69094

分享到:更多 ()