DDQN-Lunar-Lander-v2

Aplicacion del algoritmo DDQN para el entorno de Open AI Lunar Lander

En el notebook DDQN Llander se muestra el codigo utlizado para los experimentos del proyecto. Asi mismo, en el archivo excel IA.xlsx se muestran los hiperparametros utlizados en cada experimento, asi como los resultados.

A continuacion se muestra una grafica con los resultados obtenidos hasta el momento (fecha 29/6/2020).

Integrantes:

Joan Conza @jncnza
David Freidenson @davfre98
Ramfis Centeno @RamfisCenteno

Actualizacion (16/7/2020):

Se siguio haciendo mas experimentos, de estos, se presentan los 2 mejores resultados:

En el primero, nos basamos en una implementacion para la resolucion del mismo problema, encontrado en https://github.com/psulkava/deep-reinforcement-learning-with-gym. De este repositorio se usaron los parámetros tales como: Learning Rate, Epsilon, Batch Size, Target Update. (El codigo de esta implementacion esta en: DDQN_LLander.ipynb, puede descargar los pesos de esta implementacion en Pesos_2518.h5)

Con estos parametros y en un entrenamiento de 7 horas se lograron los siguientes resultados (para 5 pruebas):

Para el segundo caso, se hace el replay en cada step para actualizar al learning model. El target model se actualiza una vez por época para mantener estabilidad. Los parametros y resultados obtenidos para este caso fueron:

Se puede ver la implementacion en el notebook DDQN_LunarLander_FrequentReplay.ipynb, la ventaja de este experimento respecto al anterior, es que solo fue necesaria media hora de entrenamiento para lograr estos resultados.

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
DDQN_LLander.ipynb		DDQN_LLander.ipynb
DDQN_LunarLander_FrequentReplay.ipynb		DDQN_LunarLander_FrequentReplay.ipynb
Ia.xlsx		Ia.xlsx
Pesos_2518.h5		Pesos_2518.h5
README.md		README.md
img.png		img.png
img2.jpeg		img2.jpeg
img3.jpeg		img3.jpeg
scores.txt		scores.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

DDQN-Lunar-Lander-v2

About

Releases

Packages

Languages

RamfisCenteno/DDQN-Lunar-Lander-v2

Folders and files

Latest commit

History

Repository files navigation

DDQN-Lunar-Lander-v2

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages