无论我们正在学习煮煎蛋还是开车,通向其他人的技能往往都是掌握新技能的途径。但是人工智能可以以相同的方式学习吗?教学AI特工发挥新的挑战,我的世界表明,它的电脑很多麻烦。
MineRL竞赛于今年早些时候宣布,它要求研究人员团队创建可以在Minecraft中成功开采钻石的AI机器人。这不是一项不可能的任务,但确实需要掌握游戏的基础知识。玩家需要了解如何砍伐树木,制作镐以及探索地下洞穴,同时躲避怪物和熔岩。这些是大多数成年人在经过几个小时的实验后可以掌握的技能,或者通过观看YouTube上的教程来学习得更快。
但是,根据将在AI会议NeurIPS上宣布并由BBC News首次报道的结果,在MineRL竞赛的660个参赛作品中,没有一个能够完成挑战。尽管机器人能够学习中间步骤,例如建造熔炉来制造耐用的镐,但没有人成功找到钻石。
“我们提出的任务非常艰巨,”帮助组织这一挑战的微软研究院首席研究员卡特娅·霍夫曼告诉卡塔尔新闻社。“虽然没有提交的代理完全解决任务,但他们已经取得了很大的进步,并学会了制作此过程中所需的许多工具。”
这可能令人惊讶,特别是当您认为AI在象棋,围棋和Dota 2等游戏中已经成功地使人类脱颖而出时。但这反映了该技术的重要局限性以及MineRL法官为真正挑战游戏界所施加的限制。团队。
MineRL中的机器人必须使用称为模仿学习和强化学习的方法进行组合学习。在模仿学习中,向坐席显示任务之前的数据,然后他们尝试模仿它。在强化学习中,他们只是被丢弃到虚拟世界中,并通过反复试验自行解决问题。
通常,人工智能只能通过结合这两种方法来应对巨大挑战。例如,著名的AlphaGo系统首先通过获取旧游戏的数据来学习玩Go。然后,它不断地发挥自己的作用,从而磨练了自己的技能,超越了所有人。