Le dataset est une base de données anonymisée comportant des informations sur l’historique de commandes, les produits achetés, les commentaires de satisfaction, et la localisation des clients depuis janvier 2017. A partir celle-ci, on doit fournir auxs équipes d’e-commerce une segmentation des clients qu’elles pourront utiliser au quotidien pour leurs campagnes de communication. Vous devrez fournir à l’équipe marketing une description actionable de votre segmentation et de sa logique sous-jacente pour une utilisation optimale, ainsi qu’une proposition de contrat de maintenance basée sur une analyse de la stabilité des segments au cours du temps.
Déroulement du projet
J’ai commencé par une segmentation RFM et on va comparer les resultats de notre clusterisation avec la segmentation.
essai de différents algorithme de clustérisations
KMEANS
DBSCAN
Hiérarchique
test de stabilité des clusters maintenance et rafraichissement algorithme
Compétences acquises
Mettre en place le modèle d’apprentissage non supervisé adapté au problème métier
Transformer les variables pertinentes d’un modèle d’apprentissage non supervisé
Adapter les hyperparamètres d’un algorithme non supervisé afin de l’améliorer
Évaluer les performances d’un modèle d’apprentissage non supervisé