日本名古屋大学的研究人员发现,合作狩猎(两个或多个捕食者合作捕获猎物)不需要大脑中复杂的认知过程。相反,合作可以建立在一套简单的规则和经验的基础上。
这些发现不仅对于理解动物之间合作行为的演变具有重要意义,而且还可能有助于开发协作人工智能(AI)系统。此类系统有潜力在团队运动和驾驶模拟等战术训练场景中充当虚拟伙伴。该研究发表在eLife上,由KazushiTsutsui、KazuyaTakeda和KeisukeFujii领导。
过去的研究已将合作狩猎与表现出复杂社会行为的哺乳动物联系起来,例如狮子和黑猩猩。然而,在认知能力较弱的物种中也发现了类似的行为,例如鳄鱼和鱼类。这表明一种更简单的机制可能负责这种形式的合作。
为了研究这个难题,筒井和他的合作者创建了一个计算模型,其中人工智能代理使用深度强化学习来学习一起狩猎。深度强化学习是一个通过在执行行为后获得奖励来强化行为的过程。
研究人员训练算法通过与环境的交互进行学习并获得特定行为的奖励。使用深度神经网络,这些算法可以处理位置和速度等输入并做出自主决策。
通过强化学习功能进行编程,人工智能捕食者代理通过一系列状态、动作和奖励与环境交互,学会了在狩猎中进行协作,目标是选择能够最大化未来奖励的行动。捕食者代理之所以合作,是因为他们的行动有效,并且期望在成功捕猎后在群体中分配奖励(猎物)。
在模拟过程中,人工智能捕食者表现出独特且互补的角色,类似于参与合作狩猎的动物的行为。例如,一名特工会追逐猎物,而另一名特工则会伏击猎物。随着捕食者数量的增加,成功率提高,狩猎所需的时间减少。
在最终测试中,人工智能代理扮演掠食者的角色,而人类参与者则充当猎物。尽管面临最初的困难,例如意外的人类动作造成的混乱,训练有素的人工智能代理仍然齐心协力捕获了人类猎物。这表明成功的合作狩猎不需要复杂的认知过程,并表明现实世界中的掠食者也可以通过一套简单的决策规则学会合作。
Tsutsui说:“我们的捕食者智能体学会了使用强化学习进行协作,而不需要类似于心理理论的复杂认知机制。”“这表明合作狩猎可以在比之前想象的更广泛的物种中进化。”
研究小组预计他们的发现将引发关于捕食者-猎物动力学决策的新实地研究。此外,该项目显示了推进协作人工智能系统的潜力,这可能会对其他需要协作解决方案的领域产生积极影响,例如自动驾驶和交通管理。