Le projet est une Analyse Exploratoire de Données. Nous partons d’un jeu de donnée issu de la banque mondiale. L’organisme “EdStats All Indicator Query” de la Banque mondiale répertorie 4000 indicateurs internationaux décrivant l’accès à l’éducation, l’obtention de diplômes et des informations relatives aux professeurs, aux dépenses liées à l’éducation.
Nous nous mettons dans la peau d’une startup de l’éducation par Internet et nous recherchons de nouveau pays intéressant.
Déroulement du projet
Le projet nous permet de prendre en main PYTHON, Anaconda, Jupyter et les bibliothèques indispensables SCIKIT-LEARN, PANDAS, NUMPY, MATPLOTLIB.
J’ai d’abord cherché les variables intéressantes, puis, évolution de ces variables pour différents pays. Enfin un classement est réalisé.
Compétences acquises
Maîtriser les opérations fondamentales du langage Python pour la Data Science
Manipuler des données avec des librairies Python spécialisées
Effectuer une représentation graphique à l’aide d’une librairie Python adaptée
Mettre en place un environnement Python
Utiliser un notebook Jupyter pour faciliter la rédaction du code et la collaboration