Comparing DQN, Dueling Double DQN and Deep Deterministic Policy Gradient applied to Robocup Soccer Simulation 2D

This work is designed to help RoboCIn team. Inside you'll find codes comparing each technique.

For 3000 test episodes:

100k training dqn:

With Helios2013 goalie:
- 52.2% defenses against Helios2013
- 74% defenses against RoboCIn2019
With RoboCIn2019 goalie:
- 51.3% defenses against Helios2013
- 80% defenses against RoboCIn2019

100k training ddqn:

With Helios2013 goalie:
- 55% defenses against Helios2013
- 70.3% defenses against RoboCIn2019
With RoboCIn2019 goalie:
- 49.3% defenses against Helios2013
- 57.1% defenses against RoboCIn2019

100k training ddpg:

With Helios2013 goalie:
- 30.2% defenses against Helios2013
- 65.8% defenses against RoboCIn2019
With RoboCIn2019 goalie:
- 10.2% defenses against Helios2013
- 35.7% defenses against RoboCIn2019

Name		Name	Last commit message	Last commit date
Latest commit History 158 Commits
Evaluating Reinforcement Learning on Robocup Soccer Simulation 2D		Evaluating Reinforcement Learning on Robocup Soccer Simulation 2D
HFO_mgm		HFO_mgm
agents		agents
formations-dt		formations-dt
graduationmgm/lib		graduationmgm/lib
shells		shells
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
change_roles.ipynb		change_roles.ipynb
poetry.lock		poetry.lock
pyproject.toml		pyproject.toml
rascunhos.ipynb		rascunhos.ipynb

Provide feedback