Yuka

Etude de cas sur YUKA

Analyser le dataset de Yuka pour répondre à la problématique du client : "Comment savoir si un aliment est sain ou non ?"

On fait une analyse du df :

Cherchons les valeurs manquantes et le pourcentage de remplissage des colonnes

Calcul des quantiles pour donner une idée du dataset

On décide désormais de supprimer des colonnes non pertinentes pour notre projet. Et on se concentre également sur la partie France.

Suppression de colonnes qui ont moins de 60% de valeurs non nulles. On réintègre tout dans un nouveau df (df_cleaned)

On sauvegarde ce nouveau DF dans un CSV. Le même procédé sera fait pour la partie USA.

On supprime les lignes dont les valeurs sont manquantes afin de conserver un dataset plus précis

Utilisation de Seaborn pour illsutrer la distribution des produits en France et aux USA

Graphique en barre pour illustrer les meilleurs produits par score de -15 a -1 ( plus le score est négatif, plus sain est le produit )

Meme graphique, cette fois-ci pour les produits aux USA ( ici on remarque que le meilleur score aux USA est de -10, contrairement à -15 en France )

Graphique pour mettre en parallèle les deux pays et leurs produits considérés comme sain, par Yuka

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md
Yuka - Partie 1.ipynb		Yuka - Partie 1.ipynb
Yuka - Partie 2.ipynb		Yuka - Partie 2.ipynb
Yuka 01.png		Yuka 01.png
Yuka 02.png		Yuka 02.png
Yuka 03.png		Yuka 03.png
Yuka 04.png		Yuka 04.png
Yuka 05.png		Yuka 05.png
Yuka 06.png		Yuka 06.png
Yuka 07.png		Yuka 07.png
Yuka 09.png		Yuka 09.png
Yuka 10.png		Yuka 10.png
Yuka 11.png		Yuka 11.png
Yuka 12.png		Yuka 12.png
YukaEtatsUnis.ipynb		YukaEtatsUnis.ipynb
report.html		report.html

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Yuka

Analyser le dataset de Yuka pour répondre à la problématique du client : "Comment savoir si un aliment est sain ou non ?"

On fait une analyse du df :

Cherchons les valeurs manquantes et le pourcentage de remplissage des colonnes

Calcul des quantiles pour donner une idée du dataset

On décide désormais de supprimer des colonnes non pertinentes pour notre projet. Et on se concentre également sur la partie France.

Suppression de colonnes qui ont moins de 60% de valeurs non nulles. On réintègre tout dans un nouveau df (df_cleaned)

On sauvegarde ce nouveau DF dans un CSV. Le même procédé sera fait pour la partie USA.

On supprime les lignes dont les valeurs sont manquantes afin de conserver un dataset plus précis

Utilisation de Seaborn pour illsutrer la distribution des produits en France et aux USA

Graphique en barre pour illustrer les meilleurs produits par score de -15 a -1 ( plus le score est négatif, plus sain est le produit )

Meme graphique, cette fois-ci pour les produits aux USA ( ici on remarque que le meilleur score aux USA est de -10, contrairement à -15 en France )

Graphique pour mettre en parallèle les deux pays et leurs produits considérés comme sain, par Yuka

About

Releases

Packages

Languages

El-alish/Yuka

Folders and files

Latest commit

History

Repository files navigation

Yuka

Analyser le dataset de Yuka pour répondre à la problématique du client : "Comment savoir si un aliment est sain ou non ?"

On fait une analyse du df :

Cherchons les valeurs manquantes et le pourcentage de remplissage des colonnes

Calcul des quantiles pour donner une idée du dataset

On décide désormais de supprimer des colonnes non pertinentes pour notre projet. Et on se concentre également sur la partie France.

Suppression de colonnes qui ont moins de 60% de valeurs non nulles. On réintègre tout dans un nouveau df (df_cleaned)

On sauvegarde ce nouveau DF dans un CSV. Le même procédé sera fait pour la partie USA.

On supprime les lignes dont les valeurs sont manquantes afin de conserver un dataset plus précis

Utilisation de Seaborn pour illsutrer la distribution des produits en France et aux USA

Graphique en barre pour illustrer les meilleurs produits par score de -15 a -1 ( plus le score est négatif, plus sain est le produit )

Meme graphique, cette fois-ci pour les produits aux USA ( ici on remarque que le meilleur score aux USA est de -10, contrairement à -15 en France )

Graphique pour mettre en parallèle les deux pays et leurs produits considérés comme sain, par Yuka

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages