Projet 2 : Analysez des données de systèmes éducatifs

2eme projet de la formation Data Scientist

repertoire GITHUB

Problématique

  Le projet est une Analyse Exploratoire de Données. Nous partons d’un jeu de donnée issu de la banque mondiale. L’organisme “EdStats All Indicator Query” de la Banque mondiale répertorie 4000 indicateurs internationaux décrivant l’accès à l’éducation, l’obtention de diplômes et des informations relatives aux professeurs, aux dépenses liées à l’éducation.

  Nous nous mettons dans la peau d’une startup de l’éducation par Internet et nous recherchons de nouveau pays intéressant.

Déroulement du projet

  Le projet nous permet de prendre en main PYTHON, Anaconda, Jupyter et les bibliothèques indispensables SCIKIT-LEARN, PANDAS, NUMPY, MATPLOTLIB.

  J’ai d’abord cherché les variables intéressantes, puis, évolution de ces variables pour différents pays. Enfin un classement est réalisé.

Compétences acquises

  • Maîtriser les opérations fondamentales du langage Python pour la Data Science
  • Manipuler des données avec des librairies Python spécialisées
  • Effectuer une représentation graphique à l’aide d’une librairie Python adaptée
  • Mettre en place un environnement Python
  • Utiliser un notebook Jupyter pour faciliter la rédaction du code et la collaboration

Laisser un commentaire