Subscribe to be notified for updates: RSS Feed

Le Scoring de qualification

Home
Articles
Fiches Méthodologiques
Le Scoring de qualification

Le Scoring de qualification

3D Character and Question MarkDans mes précédents articles, je vous ai présenté le scoring dans sa globalité (Cf. article), avec les méthodes de pilotage de sa performance (Cf. article) et avec un exemple d’application marketing (Cf. article).
Aujourd’hui, j’aimerais vous sensibiliser à la possibilité d’utiliser cette technique dans ce que l’on appelle couramment de la qualification. Mais de quoi s’agit-il … ?

Définition : La qualification par scoring consiste à modéliser une information en partie manquante, voir totalement manquante, sur un portefeuille de clients ou de prospects.

Exemple : L’Age et la CSP sont des variables socio démographiques parmi les plus impactantes sur le comportement d’un individu.
En effet, on comprend bien qu’un étudiant de la place St Pierre à Toulouse n’aura pas le même comportement d’achat qu’un retraité sur la côte d’azur.
But : Ce type de projet a donc pour objectif d’arriver par le biais de l’ensemble des informations disponibles à extrapoler la donnée manquante afin de l’utiliser pour d’autre analyses.
Exemple : Chez la plupart des opérateurs téléphoniques, lorsque vous avez moins de 26 ans, vous pouvez beneficier d’un avantage « SMS illimités » 24/24, 7/7.
Un opérateur souhaitant diffuser un emailing publicitaire pour mettre en avant ce produit à son lancement ne peut pas se permettre de l’envoyer à tout ses clients, premièrement car cela lui coûterait très cher … et secondement tout les clients de plus de 26 ans recevant ce message seraient hors cible.
Dans ce cas précis, imaginons que l’opérateur ne connaisse la date de naissance uniquement que de 50% de ses clients … l’opérateur ne pourrait donc pas contacter ses clients. Il va donc chercher à extrapoler l’âge des clients manquants afin de récupérer une partie de ce potentiel.
Méthodologie: Ici, nous allons être globalement confronté à deux cas de figure, un cas simple et un cas un peu plus complexe.
Le 1er cas consiste à modéliser une variable binaire, c’est-à-dire à 2 modalités (0/1). Ici c’est assez simple, on utilise la régression logistique classique et on déroule. (Si besoin cf. article Le Scoring).
Dans l’exemple de notre opérateur, cela revient à modéliser la probabilité d’avoir moins de 26 ans.
Le 2nd cas un peu plus complexe consiste a modéliser une variable polynomiale, c’est-à-dire à plus de 2 modalités. Ici, on va devoir soit faire un score pour chaque modalité … soit passer par une régression polytomique. (Ce cas fera d’ailleurs prochainement le sujet d’un article afin d’être complet)
Dans l’exemple de notre opérateur cela revient à modéliser la probabilité que le client ait moins de 26ans, ou entre 26 et 46 ans, ou entre 46 et 66 ans ou plus de 66 ans.
Conclusion : Ainsi à partir de maintenant, n’excluez plus les données faiblement remplies, si elles vous semblent pertinentes en terme « métier », essayez d’abord de les compléter via une modélisation.

Il n'y a pas encore de commentaires, mais vous pouvez être le premier



Laissez un commentaire



Error. Page cannot be displayed. Please contact your service provider for more details. (19)

Copyright 2013 lesitedesdataminers.fr