https://ift.tt/2PlwG5h
近日OpenAI在Dota 2上的表现,让强化学习又火了一把,但是 OpenAI 的强化学习训练环境 OpenAI Gym 却屡遭抱怨,比如不太稳定、更新不够及时等。今日,谷歌推出了一款全新的开源强化学习框架 Dopamine,该框架基于 TensorFlow,主打灵活性、稳定性、复现性,能够提供快速的基准测试。
By 谷歌博客 Translated by 无明
IT.数码
via 未注册用户的 InfoQ 个性化 RSS Feed – 请注册后升级! http://www.infoq.com/cn
August 30, 2018 at 09:39AM