AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

OpenAI Gym 强化学习算法工具包

程序名称：OpenAI Gym

授权协议: MIT

操作系统: 跨平台

开发语言: Python

OpenAI Gym 介绍

OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。

gym 不对代理的结构做任何假设，并且与任何数值计算库兼容，例如 TensorFlow 或 Theano。

有关 OpenAI Gym 的白皮书，请访问 http://arxiv.org/abs/1606.01540，这里有一个 BibTeX
条目，可以在出版物中引用它：

@misc{1606.01540,
  Author = {Greg brockman and Vicki Cheung and Ludwig PetteRSSon and Jonas Schneider and John Schulman and Jie Tang and Wojciech Zaremba},
  Title = {OpenAI Gym},
  Year = {2016},
  Eprint = {arXiv:1606.01540},
}

强化学习有两个基本概念：环境（即外部世界）和代理（即你正在编写的算法）。代理向环境发送操作，环境回复观察和奖励（即分数）。

核心的 gym 界面是 Env，它是统一的环境界面。没有代理商界面。以下是应该了解的 Env 方法：

reset(self):：重置环境的状态。返回观察。
step(self, action)：一步一步进入环境。返回观察、奖励、完成、信息。
render(self, mode=’human’)：渲染一帧环境。默认模式将执行人性化的操作，例如弹出窗口。

可以执行最小的安装：

git clone https://github.com/openai/gym.git
cd gym
pip install -e .

可以直接从 PyPI 进行最小的打包版本安装：

pip install gym

可以立即运行一些环境：

算法
toy_text
classic_control（需要 pyglet 来渲染）

建议首先使用这些环境，然后再安装其余环境的依赖项。

OpenAI Gym 官网

https://gym.openai.com/

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

机器学习/深度学习

相关推荐

欧盟第7框架计划(FP7)的LarKC项目的目标是开发大规模知识加速器(LarKC，其发音为“lark”)，LarKC被设计为一个大规模分布式不完备推理平台，该平台用于突破语义万维网(Semantic Web)推理系统目前面临的知识处理规

作者：编程之家时间：2022-07-31

Salad 是一种有效且灵活的实现著名的异常检测方法回文构词法王et al . 2006(RAID)。Salad

作者：编程之家时间：2022-07-31

multilanguage 是一个多语开发工具包，用于缓存多语系统的多语值，它拥有良好的性能，并且能防止内存泄露。

作者：编程之家时间：2022-07-31

go-cortex 是一个服务，通过倾听你的句子，并视图理解你的意思，然后执行相应的动作。它使用 Wit.ai

作者：编程之家时间：2022-07-31

DKPro Core 是基于 Apache UIMA 框架之上的自然语言处理（NLP）的软件组件。DKPro Core 提供了这样的第三方工具以及原NLP组件的包装。

作者：编程之家时间：2022-07-31

NLTK 会被自然地看作是具有栈结构的一系列层，这些层构建于彼此基础之上。那些熟悉人工语言（比如

作者：编程之家时间：2022-07-31

ERNIE 是基于持续学习的语义理解预训练框架，使用多任务学习增量式构建预训练任务。

作者：编程之家时间：2022-07-31

Algorithm research AC 编译及使用方法实例1返回值实例2返回值

Algorithm research 基于 AC 有限状态自动状态机的过滤服务。 AC 编译及使用方法 1. 编译之前请先确认安装好 libevent

作者：编程之家时间：2022-07-31

spaCy 是一个 Python 和 CPython 的 NLP 自然语言文本处理库。示例代码： >>> import spacy.en

作者：编程之家时间：2022-07-31

Lango 是自然语言处理库，类似乐高游戏，可以把各个语言块构建在一起工作。

作者：编程之家时间：2022-07-31