Don't understand Spanish? Read it in English instead
SmartBite es una herramienta de IA que identifica platos de comida en fotos, proporcionando detalles sobre ingredientes, alérgenos, macronutrientes y calorías. Mejora tu salud y bienestar con una alimentación consciente y equilibrada. 🍽️🌿
Pruébalo en acción en las GitHub Pages del repositorio o en la web de Hugging Face.
Nace como resultado de un proyecto de fin de curso de AI Saturdays 🤖 ALICANTE, con la idea de realizar una herramienta basada en inteligencia artificial que reconociera un plato de comida en una fotografía e identificara sus ingredientes, alérgenos, macronutrientes y calorías (aproximación en porción/gramos) para ese plato.
Podría contribuir a mejorar la salud y el bienestar de las personas. Al ayudarles a ser conscientes de lo que comen, puede ayudar a prevenir enfermedades relacionadas con la obesidad y la diabetes. Además, se busca promover una alimentación equilibrada y sostenible, informando sobre la importancia de una nutrición adecuada.
Sergio Maciá |
Javier Maciá |
Antonio Díaz-Parreño |
- Ha sido entrenado utilizando de base el modelo InceptionV3 de la librería de Keras de Tensorflow.
- Actualmente, el modelo tiene un ratio aproximado de acierto del 84%, y una pérdida de 0.9252.
- Dentro de la carpeta
model
se puede encontrar un documento más detallado sobre la evaluación del modelo (scoring). - Ha sido entrenado con 101 platos que pueden verse aquí.
En la carpeta gogle-collab
puedes encontrar un par de Notebooks para entrenar y utilizar el modelo para hacer predicciones. En los cuadernos, encontrarás el código dividido en bloques y explicado paso a paso.
Si por el contrario prefieres ejecutarlo en tu máquina, sigue las instrucciones del apartado Requerimientos.
Si ejecutas los cuadernos de Google Collab, no es necesario que hagas ninguna instalación en tu máquina. Tienes instrucciones sobre las dependencias del proyecto en el propio cuaderno.
Si decides descargarte el proyecto y ejecutarlo en tu máquina, necesitarás:
- Python, para ejecutar los scripts.
- Para el desarrollo fue utilizado Python v3.12.3. Puedes instalarlo aquí
- Tensorflow v2.16.1, para ejecutar el modelo.
- Gradio, para generar una interfaz web desde donde cargar las imágenes.
- Git LFS, dado que el modelo pesa más de 100MB, es necesario para manejar archivos grandes en git.
Si deseas entrenar o afinar el modelo utilizando la misma configuración del proyecto, en la carpeta scripts
tienes los scripts de Python que han sido utilizados tanto para entrenar el modelo como para usarlo para hacer predicciones.
El dataset que se ha utilizado se llama Food101. Tienes más información en datasource/images