Skip to content

El-alish/Yuka

Repository files navigation

Yuka

Etude de cas sur YUKA

Analyser le dataset de Yuka pour répondre à la problématique du client : "Comment savoir si un aliment est sain ou non ?"

On fait une analyse du df :

Cherchons les valeurs manquantes et le pourcentage de remplissage des colonnes

Calcul des quantiles pour donner une idée du dataset

On décide désormais de supprimer des colonnes non pertinentes pour notre projet. Et on se concentre également sur la partie France.

Suppression de colonnes qui ont moins de 60% de valeurs non nulles. On réintègre tout dans un nouveau df (df_cleaned)

On sauvegarde ce nouveau DF dans un CSV. Le même procédé sera fait pour la partie USA.

On supprime les lignes dont les valeurs sont manquantes afin de conserver un dataset plus précis

Utilisation de Seaborn pour illsutrer la distribution des produits en France et aux USA

Graphique en barre pour illustrer les meilleurs produits par score de -15 a -1 ( plus le score est négatif, plus sain est le produit )

Meme graphique, cette fois-ci pour les produits aux USA ( ici on remarque que le meilleur score aux USA est de -10, contrairement à -15 en France )

Graphique pour mettre en parallèle les deux pays et leurs produits considérés comme sain, par Yuka

About

Etude de cas sur YUKA

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published