GitHub - for-ai/rl: Generic reinforcement learning codebase in TensorFlow

FOR.ai Reinforcement Learning Codebase

Modular codebase for reinforcement learning models training, testing and visualization.

Contributors: Bryan M. Li, Alexander Cowen-Rivers, Piotr Kozakowski, David Tao, Siddhartha Rao Kamalakara, Nitarshan Rajkumar, Hariharan Sezhiyan, Sicong Huang, Aidan N. Gomez

Features

Agents: DQN, Vanilla Policy Gradient, DDPG, PPO
Environments:
- OpenAI Gym
  - support both Discrete and Box environments
  - render (--render) and save (--record_video) environment replay
- OpenAI Atari
- OpenAI ProcGen
Model-free asynchronous training (--num_workers)
Memory replay: Simple, Proportional Prioritized Experience Replay
Modularized
- hyper-parameters setting (--hparams)
- action functions)
- compute gradient functions
- advantage estimation
- learning rate schemes

Example for recorded envrionment on various RL agents.

MountainCar-v0	Pendulum-v0	VideoPinball-v0	procgen-coinrun-v0

Requirements

It is recommended to install the codebase in a virtual environment (virtualenv or conda).

Quick install

Configure use_gpu and (if on OSX) mac_package_manager (either macports or homebrew) params in setup.sh, then run it as

sh setup.sh

Manual setup

You need to install the following for your system:

TensorFlow
OpenAI Gym
OpenAI Atari
OpenAI ProcGen
FFmpeg
Additional python packages pip install -r ../requirements.txt

Quick Start

# start training
python train.py --sys ... --hparams ... --output_dir ...
# run tensorboard
tensorboard --logdir ...
# test agnet
python train.py --sys ... --hparams ... --output_dir ... --test_only --render

Hyper-parameters

Check available flags with --help, defaults.py for default hyper-parameters, and check hparams/dqn.py agent specific hyper-parameters examples.

hparams: Which hparams to use, defined under rl/hparams
sys: Which system environment to use.
env: Which RL environment to use.
output_dir: The directory for model checkpoints and TensorBoard summary.
train_steps:, Number of steps to train the agent.
test_episodes: Number of episodes to test the agent.
eval_episodes: Number of episodes to evaluate the agent.
test_only: Test agent without training.
copies: Number of independent training/testing runs to do.
render: Render game play.
record_video: Record game play.
num_workers, number of workers.

Documentation

More detailed documentation can be found here.

Contributing

We'd love to accept your contributions to this project. Please feel free to open an issue, or submit a pull request as necessary. Contact us [email protected] for potential collaborations and joining FOR.ai.

Name		Name	Last commit message	Last commit date
Latest commit History 62 Commits
docs		docs
gif		gif
rl		rl
tests		tests
.gitignore		.gitignore
.readthedocs.yml		.readthedocs.yml
.style.yapf		.style.yapf
.travis.yml		.travis.yml
LICENSE		LICENSE
README.md		README.md
benchmark.md		benchmark.md
paper.bib		paper.bib
paper.md		paper.md
requirements.txt		requirements.txt
setup.sh		setup.sh
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FOR.ai Reinforcement Learning Codebase

Features

Requirements

Quick install

Manual setup

Quick Start

Hyper-parameters

Documentation

Contributing

About

Releases 2

Packages

Contributors 7

Languages

License

for-ai/rl

Folders and files

Latest commit

History

Repository files navigation

FOR.ai Reinforcement Learning Codebase

Features

Requirements

Quick install

Manual setup

Quick Start

Hyper-parameters

Documentation

Contributing

About

Topics

Resources

License

Stars

Watchers

Forks

Releases 2

Packages 0

Contributors 7

Languages

Packages