GitHub - taniafollonier/PI1_MLOps_Steam_Games: Repositorio para Proyecto Individual 1 - Utilización de API para el consumo de Dataset de Juegos Steam - Incluyendo modelo de Machine Learning -

💻 STACK TECNOLÓGICO:

💻 INTRODUCCIÓN:

En este proyecto se trabaja sobre la plataforma online de juegos Steam, desarrollando un rol de Data Engineer para lograr tener un MVP (Minimum Viable Product). Debe contener una API con sus correspondientes endpoints de funciones deployadas en Render, con un Modelo de Machine Learning que contenga un análisis de sentimiento con NLP, a partir de los comentarios de los usuarios y un sistema de recomendación de videojuegos para los usuarios de la plataforma.

💻 FUENTES:

Para desarrollar el proyecto se basa en 3 datasets, almacenados como archivos JSON GZIP:

australian_user_reviews.json: Conjunto de datos con id de usuarios y sus comentrios de los juegos, su recomendación o no, así como también la url del perfil de usuario y el id del juego.
australian_users_items.json: Conjunto de datos con información de los juegos, y el tiempo acumulado de juego por cada usuario.
output_steam_games.json: Conjunto de datos con títulos, géneros, id de los juegos, sus precios y características.

Los detalles en el Diccionario de datos

💻 TAREAS DESARROLLADAS:

Se llevó a cabo un proceso de ETL (Extracción, Transformación y Carga), analizando el tipo de dato de cada columna de los distintos datasets, transformándolos cuando fuera necesario, eliminando duplicados, eliminando columnas con valores nulos, desanidando 2 columnas. También se procedió a eliminar las columnas que no iban a ser de utilidad para el posterior análisis, cración de funciones y endpoints de API. Para la realización de la consigna de realizar un un análisis de sentimiento a los comentarios de los usuarios, se introdujo una nueva columna llamada 'sentiment_analysis', la cual sustituye a la columna que originalmente contenía los comentarios de los usuarios. Esta columna clasifica los sentimientos de los comentarios según la siguiente escala: 0 si el sentimiento es negativo, 1 si es neutral o si no hay un comentario asociado, 2 si el sentimiento es positivo. Para aplicar el análisis de sentimiento con NLP, se utilizó la biblioteca textBlob, que clasifica la polaridad del texto como positiva, negativa o neutra. Se guardaron los datasets limpios en archivos de tipo parquet. Luego se procedió a la realización del EDA (Análisis Exploratorio de Datos), para identificar los datos necesarios para la posterior realización del modelo de recomendación. Se usaron las librerías Matplotlib y Seaborn para la visualización. Se crearon los archivos:
ETL_Steam_Games
ETL_user_items
ETL_users_reviews
Feature_Engineering_EDA

💻 CREACIÓN DE API:

El desarrollo de la API se realizó usando el framework FastAPI, generando las 5 funciones propuestas para las consultas:

PlayTimeGenre:_ Debe devolver año con mas horas jugadas para dicho género.
UserForGenre: Debe devolver el usuario que acumula más horas jugadas para el género dado y una lista de la acumulación de horas jugadas por año.
UsersRecommend: Devuelve el top 3 de juegos MÁS recomendados por usuarios para el año dado.
UsersNotRecommend: Devuelve el top 3 de juegos MENOS recomendados por usuarios para el año dado.
sentiment_analysis: Según el año de lanzamiento, se devuelve una lista con la cantidad de registros de reseñas de usuarios que se encuentren categorizados con un análisis de sentimiento.

Posteriormente, se realizó el Modelo de Recomendación Automático, utilizando el sistema de recomendación item-item. Para su realización se utilizó la similitud del coseno, que determina cuán similares son dos conjuntos de datos o elementos, y se calcula utilizando el coseno del ángulo entre los vectores que representan esos datos o elementos.

recomendacion_juego: Ingresando el id de producto, deberíamos recibir una lista con 5 juegos recomendados similares al ingresado.

El código para generar la API se encuentra en el archivo Main. En caso de querer ejecutar la API desde localHost se deben seguir los siguientes pasos:

Clonar el proyecto haciendo git clone https://github.com/taniafollonier/PI1_MLOps_Steam_Games.git.
Preparación del entorno de trabajo en Visual Studio Code: * Crear entorno python -m venv env * Ingresar al entorno haciendo env\Scripts\activate * Instalar dependencias con pip install -r requirements.txt
Ejecutar el archivo main.py desde consola activando uvicorn. Para ello, hacer uvicorn main:app --reload
Hacer Ctrl + clic sobre la dirección http://XXX.X.X.X:XXXX (se muestra en la consola).
Una vez en el navegador, agregar /docs para acceder a ReDoc.
En cada una de las funciones hacer clic en Try it out y luego introducir el dato que requiera o utilizar los ejemplos por defecto. Finalmente Ejecutar y observar la respuesta.

Para el deploy de la API se seleccionó la plataforma Render que es una nube unificada para crear y ejecutar aplicaciones y sitios web, permitiendo el desplegue automnático desde GitHub.

Se generó un nuevo servicio en render.com, conectando a este repositorio
Se genera el link donde queda corriendo

Las funciones para los Endpoints se encuentran en el archivo main

Los Endpoints fueron cargados en FastAPI para su posterior deploy FastAPI

💻 DEPLOYMENT:

Luego de verificar que la API funciona a nivel local, se procedió a usar Render para que la misma pueda ser consumida desde la web. Dado que el servicio gratuito de Render consta de poca memoria, se optó por un muestreo porcentual de los Dataframes pertinentes.

Se puede observar en el siguiente link: Render

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
Images		Images
Jupyter		Jupyter
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

taniafollonier/PI1_MLOps_Steam_Games

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages