Fb研究人员建议为Minecraft提供AI助手

对于那些一直希望Minecraft拥有可以执行您所要求的所有职责的Alexa风格的向导的人,您真幸运。不久前,Fb研究人员呼吁建立一个用于纯语言理解分析(NLU)的协作和交互式Minecraft机器人。他们认为,《我的世界》的约束条件使其非常适合NLU各个子域中的实验。为此,他们免费提供了GitHub上的基本信息,代码,标签工具和基础架构。

LIGHT在一定程度上支持了他们的工作,LIGHT是在涉及成员团队的大规模文本旅程中进行的一种开放式分析环境,其中AI程序和人员作为角色一起工作。洛林(Lorraine)个人计算机及其用途分析实验室Fb AI Analysis的科学家以及伦敦大学学院的科学家在今年早些时候透露的一篇文章中详细介绍了LIGHT。

“无论与数字助理相关的各种基本分析指令如何,这些指令本身都不应该是分析社区的最终平台。他们已经深入学习并需要大量的国际信息,它们通常具有复杂的代码库,这些代码库由很多人运行,并且甚至有1000名工程师”在Arxiv.org上刊登的印前文章中写道。“此外,它们的独特性质和工业意义使其实验变得麻烦。作为“现实世界”助手的替代品,我们建议在Minecraft沙箱开发娱乐系统中工作。”

对于这些陌生人,Minecraft是一个基于体素的构造,并以程序化方式创建了娱乐世界,其中包含灌木丛,山脉,田野,动物,非玩家角色(NPC)以及许多其他事物。这些块位于3D体素网格上,并且网格内的每个体素都包含一块布料。玩家可以转移,放置或删除各种类型的方块,并且可以攻击或击退NPC或其他玩家的攻击。

研究人员然后在这项运动的聊天窗口中描述了一个Minecraft机器人,该机器人具有纯语言说明(例如,“建造15个街区的塔楼,然后放一个巨大的笑脸”)。他们承认,这项操作要比完成操作简单易行,尤其是由于游戏玩家可能要求机器人执行任务的复杂性。在上面的例子中–“在高出15米的地方建造一座塔,然后放一个巨大的笑脸”,助手应意识到“旅途”和“笑脸”的含义,并找出如何建造它们;知道“ 15块高”可以测量塔顶;承认“ 15”的意思;并调和相对位置“上方”。

尽管如此,该杂志的合著者断言,Minecraft工作区和周围环境具有“规则性”,可以用来简化职责的执行。例如,可能会使用生成模式处理指令的语言/运动模特单元来创建教练信息,并告知该机器人底层NLU方式的构造。以及,Minecraft构造可能会充当AI和参与者之间共享的有用信息的信息。例如,如果消费者要求向导“创建一个笑脸”,则代理可以推断出“笑脸”是一种阻止对象,因为“笑脸”的发展“是机器人已经理解的标准过程。 。

研究人员主张采用一种模块化方法来简化假设助手的设计及其后续分析。他们建议,想要执行Minecraft基本职责(类似于规划和构建路径)的动作可以通过访问运动的内部状态来编写。而且,他们说通过记录参与者与向导的交互来收集或生成有关操作的信息可能相对简单。

机组人员认为,“参与式”和“令人愉快”的Minecraft机器人面临着巨大的挑战。它必须立即意识到反馈,因为延迟通常会严重影响游戏玩家的效率印象,因此应通过澄清要求与游戏玩家“最佳”合作,而不必将他们从令人尴尬的问题中剔除。无论哪种障碍,机组人员都坚信,《我的世界》非常适合通过互动学习,特别是通过语言互动学习。

“ [I]作为[探索] ML策略的替代方法[可以]可以研究周围环境的表示,从而使特工能够成功行事……我们着迷于允许特工掌握参与者意图的方法问题考虑到我们能够想到的最有利的环境……并通过交互作用来增强效果,“写l' ;船员。“我们认为,咨询师的论点是我们将无法在研究插图的策略内在基本进展方面成功地解决NLU的问题,但是无论如何,我们希望现在是尝试的时候。”

栏目推荐