教一台AI处理以前从未见过的情况
南加州大学维特比工程学院信息科学研究所(ISI)的研究人员已与普渡大学合作,参加了由国防高级研究计划局(DARPA)资助的计划,该计划旨在发展使AI系统适应新事物的科学。 ,或以前从未见过的新条件。
以经过培训可以玩标准大富翁游戏的AI为例。如果您更改规则,以便可以在不首先获得垄断的情况下购买房屋和酒店,该怎么办?如果游戏设置为在100转后结束而不是等待破产,该怎么办?这些都是新颖的事物,会影响最佳的获胜策略。
然而,正如该项目的主要研究人员和南加州大学维特比分校的助理教授Mayank Kejriwal所补充的那样,即使到今天,最先进的AI仍无法应对这种新颖性。
Kejriwal表示:“即使AI取得了许多进步,但它们都是特定于任务的。” “当您引入没有专门为AI处理的更改时,您必须返回并重新培训该程序。没有通用的AI可以适应新颖的情况。我们确实处于未知领域,因为没有新奇科学。”
他补充说:“这就是该项目的意义。” “这不仅仅是改善某些特定的AI模块。通过开发新颖性的科学,我们为下一代AI奠定了基础。”
人工智能与开放世界学习科学计划(SAIL-ON)计划或SAIL-ON计划于2019年11月开始,并将持续到2023年。在计划结束时,美国国防部希望将这项研究用于从自动救灾机器人到自动驾驶军车,其应用范围非常广泛。USC和Purdue的合作团队已从DARPA那里获得了120万美元的拨款,随着该计划的进行,该团队可能会获得更多。
在某些方面,人工智能已经超越了人类的能力。Kejriwal引用了AlphaZero作为例子,该计算机程序使用机器学习来玩象棋和围棋之类的棋盘游戏,现在甚至可以击败最先进的人类玩家。
不幸的是,由于无法处理新颖性,大多数成功的AI应用程序(例如AlphaZero)仅限于具有固定规则和目标的任务。
Kejriwal补充说,如果我们希望AI系统在现实环境中成功运行,则需要它们处理以前从未见过的事情。现实世界充满了新情况。
Kejriwal说:“ COVID-19是新颖性的完美例证。” “这并不是像我们受过训练来处理这个问题,而是我们想出了办法并加以适应。人工智能不会知道该怎么做。”
例如,他谈到了一个AI安全系统,其目的是保护在线零售商免受不同类型的网络攻击。当大流行导致人们从零售商那里紧急购买厕纸时,AI看到了比以往更多的此类要求。由于不了解该流行病的影响,系统认为该流行病已受到攻击并阻止了所有有效请求。面对这种新颖的情况,人工智能无法适应。
Kejriwal说,现实世界中存在无限多种可能性,这意味着AI不可能预见可能发生的一切。“对每种可能性的预期不足,您实际上如何学会像人类一样对待新颖性?” 他问。“在这个项目中,我们希望为此建立一个完整的范例,而目前尚不存在。”
该计划旨在开发用于处理许多领域中新颖性的通用解决方案,但每个小组都选择了特定的领域进行测试。ISI的研究人员致力于棋盘游戏领域,尤其是Monopoly,而Purdue的研究人员则专注于拼车游戏。
在垄断的情况下,就像现实世界一样,有无数种方法可以引入新颖性。
除了前面提到的可能的规则更改之外,Kejriwal解释说,您可以添加更多的骰子,选择不同的路径,更改游戏的目标,甚至引入团队合作的动机。
他说:“人工智能必须适应所有这一切,并且事先不知道会发生什么类型的新颖性。”
同样,对于管理乘车共享应用程序的AI系统来说,实时更改太多,以至于无法单独解决所有问题。普渡大学副教授,项目负责人之一Vaneet Aggarwal谈到了人工智能在该领域的适应性的重要性。
他说:“我们希望算法能够扩展到我们周围发生的不同事情。” “它应该适应不同的国家,不同的城市,不同的规定以及任何意外事件,例如道路阻塞。”
Aggarwal补充说,该项目中开发的基础新颖性科学不仅对乘车共享或游戏玩法有用。他说:“这将适用于必须在不确定条件下进行决策的任何地方。”