DeepMind的AI再次打败人类玩家，“攻下”57款雅达利游戏

镁客maker网 2020-04-02 14:06 发文

Agent57为我们构建更加强大的AI决策模型奠定了基础。

AI打游戏会比普通人优秀？DeepMind给了肯定的答案。近日，DeepMind宣布它们的智能体Agent57首次在所有57款雅达利游戏上超越人类玩家。

近年来，DeepMind一直在研究提高智能体在游戏环境下的智能性，通常情况下，智能体在游戏中能够应对的环境越复杂，它在真实环境中的适应能力也会越强。

此次Agent57挑战的街机学习环境（Arcade Learning Environment，ALE）包括57款游戏，为智能体的强化学习提供了复杂的挑战。

而之所以会选择雅达利游戏作为训练的数据集，DeepMind表示雅达利游戏足够多样化，可以评估智能体的泛化性能，其次它可以模拟在真实环境中可能遇到的情况，并且雅达利游戏是由独立的组织构建，可以避免实验偏见。

据悉，Agent57在多台计算机上并行执行，并启用强化学习算法（Reinforcement learning，RL）驱动智能体采取行动，使得奖励的效果最大化。此前，强化学习在游戏领域就取得不少进展，比如OpenAI的OpenAI Five和DeepMind的AlphaStar RL智能体分别打败了99.4%的Dota 2玩家和99.8%的星际2玩家。