OpenAI Gym 介绍
OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。
gym 不对代理的结构做任何假设,并且与任何数值计算库兼容,例如 TensorFlow 或 Theano。
有关 OpenAI Gym 的白皮书,请访问 http://arxiv.org/abs/1606.01540,这里有一个 BibTeX
条目,可以在出版物中引用它:
@misc{1606.01540, Author = {Greg brockman and Vicki Cheung and Ludwig PetteRSSon and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba}, Title = {OpenAI Gym}, Year = {2016}, Eprint = {arXiv:1606.01540}, }
强化学习有两个基本概念:环境(即外部世界)和代理(即你正在编写的算法)。代理向环境发送操作,环境回复观察和奖励(即分数)。
核心的 gym 界面是 Env,它是统一的环境界面。没有代理商界面。以下是应该了解的 Env 方法:
- reset(self)::重置环境的状态。返回观察。
- step(self, action):一步一步进入环境。返回观察、奖励、完成、信息。
- render(self, mode=’human’):渲染一帧环境。默认模式将执行人性化的操作,例如弹出窗口。
可以执行最小的安装:
git clone https://github.com/openai/gym.git cd gym pip install -e .
可以直接从 PyPI 进行最小的打包版本安装:
pip install gym
可以立即运行一些环境:
- 算法
- toy_text
- classic_control(需要 pyglet 来渲染)
建议首先使用这些环境,然后再安装其余环境的依赖项。
OpenAI Gym 官网
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。