par Frances Keeping - Mis en ligne le 28/01/2003
Le datamining consiste à utiliser des
méthodes automatisées pour révéler la
signification - sous forme de tendances,
courbes et relations - de
données électroniques accumulées. L'une des applications les plus courantes
du datamining consiste à cibler
les nouveaux clients potentiels les plus
probables.
Une autre tâche courante
est la segmentation de marché. Un segment
de marché est un groupe de
clients qui partagent certaines caractéristiques
comme la longévité en tant
que client, les dépenses moyennes, les
achats types, et ainsi de suite. La découverte
des similitudes qui caractérisent
et distinguent les segments met
en oeuvre des calculs massifs qui sont
l'essence même du datamining.
Quand vous décidez d'adopter le
datamining, ne cherchez pas plus loin que SQL Server. En effet, l'arbre de décision
et les algorithmes de datamining
« clustering » que Microsoft fournit
dans SQL Server 2000 Analysis Services, conviennent parfaitement
aux tâches d'acquisition de nouveaux
clients et de segmentation de vos marchés.
(Pour plus d'informations sur les algorithmes de datamining de
Microsoft, voir l'article de Jim Yang,
ZhaoHui Tang, Sanjay Soni et autres,
« Le datamining au travail » lettre SQL
Server N°2 Mars 2002.) A l'aide d'un
exemple, voyons comment vous pouvez
utiliser Analysis Services pour effectuer
ces tâches, puis examiner les
informations utiles tirées de l'analyse.
L’exemple de scénario implique l’entreprise
imaginaire Conference Corp,
qui informe l’industrie sur les nouvelles
tendances et technologies informatiques
au moyen de conférences,
d’ateliers et de séminaires. La nature
« sur invitation seulement » exclusive
des événements exige le développement
d’outils promotionnels ciblés et de grande qualité, comme des offres
personnalisées et des brochures de
conférences. Le ciblage est particulièrement
important parce que les outils
et les supports de qualité coûtent cher
à produire et à adresser. La société vise
des taux de réponse et d’assistance élevés,
en analysant continuellement l’efficacité
de ses campagnes promotionnelles.
La base de données de la société
est organisée autour d’une entité
client: la table Customers. Cette table
et deux autres – Promotions et
Conferences – définissent l’objet
Customer. La figure 1 montre les tables
et leurs champs constitutifs.
Les clients reçoivent de nombreuses
promotions pour de nombreux
événements et, après avoir reçu une promotion, soit ils l’ignorent soit
ils l’enregistrent et assistent à l’événement
correspondant. Disons que votre
travail consiste à examiner les « touchés
et ratés » promotionnels et à déterminer
quelles caractéristiques prédisposent
les clients à assister à
l’événement en question. Quand vous
les connaîtrez, vous pourrez mieux cibler
les promotions d’événement suivantes.
Un ciblage précis diminue les
coûts promotionnels et vous permet
de mieux servir vos clients en leur offrant
les informations pertinentes pour
leurs centres d’intérêt. Une telle personnalisation
bâtit la fidélité durable
du client.
Pour déterminer les caractéristiques
des clients et des prospects les
plus susceptibles de répondre à votre
offre promotionnelle, vous devez
d’abord regrouper et analyser les ensembles
de données contenant des réponses
et des non-réponses à une ou
plusieurs offres. De plus, vous devez
constituer un ensemble de données
contenant suffisamment d’informations
distinctives pour vous aider à estimer
la probabilité d’une réponse
d’après certaines caractéristiques.
Votre observation de la réussite ou
de l’échec des précédentes campagnes
de marketing de Conference Corp indique
que la probabilité de réponse est
fonction du type de travail du client, de
la taille de la firme, et de ses ventes annuelles.
Il vous semble aussi que les
taux de réponses varient d’après les caractéristiques
de la relation client : depuis
quand la personne est-elle cliente,
la présence à des événements précédents
et autres. De plus, les managers
de Conference Corp ont observé que la
réponse semble être liée au type
d’offre, à la remise, et aux politiques de
coupons, ainsi qu’au nombre de promotions
précédemment envoyées au
prospect visé.
Il est difficile de faire le tri de tous
ces prédicteurs potentiels pour trouver
la combinaison unique d’attributs
qui décrit le mieux le client le plus
suceptible de répondre, sauf si l’on dispose d’un algorithme de recherche
de profil automatisé. Comme je le démontre
plus loin, les arbres de décision
de datamining conviennent parfaitement
pour effectuer ce genre de recherche
de profil.
Téléchargez cette ressource
Livre blanc Sécurité et Stockage des documents
Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.