> Data > Le datamining à  moindres frais

Le datamining à  moindres frais

Data - Par iTPro.fr - Publié le 24 juin 2010
email

par Frances Keeping - Mis en ligne le 28/01/2003
Le datamining consiste à  utiliser des méthodes automatisées pour révéler la signification - sous forme de tendances, courbes et relations - de données électroniques accumulées. L'une des applications les plus courantes du datamining consiste à  cibler les nouveaux clients potentiels les plus probables.

Une autre tâche courante est la segmentation de marché. Un segment de marché est un groupe de clients qui partagent certaines caractéristiques comme la longévité en tant que client, les dépenses moyennes, les achats types, et ainsi de suite. La découverte des similitudes qui caractérisent et distinguent les segments met en oeuvre des calculs massifs qui sont l'essence même du datamining.

Quand vous décidez d'adopter le datamining, ne cherchez pas plus loin que SQL Server. En effet, l'arbre de décision et les algorithmes de datamining « clustering » que Microsoft fournit dans SQL Server 2000 Analysis Services, conviennent parfaitement aux tâches d'acquisition de nouveaux clients et de segmentation de vos marchés. (Pour plus d'informations sur les algorithmes de datamining de Microsoft, voir l'article de Jim Yang, ZhaoHui Tang, Sanjay Soni et autres, « Le datamining au travail » lettre SQL Server N°2 Mars 2002.) A l'aide d'un exemple, voyons comment vous pouvez utiliser Analysis Services pour effectuer ces tâches, puis examiner les informations utiles tirées de l'analyse.

Le datamining à  moindres frais

L’exemple de scénario implique l’entreprise
imaginaire Conference Corp,
qui informe l’industrie sur les nouvelles
tendances et technologies informatiques
au moyen de conférences,
d’ateliers et de séminaires. La nature
« sur invitation seulement » exclusive
des événements exige le développement
d’outils promotionnels ciblés et de grande qualité, comme des offres
personnalisées et des brochures de
conférences. Le ciblage est particulièrement
important parce que les outils
et les supports de qualité coûtent cher
à  produire et à  adresser. La société vise
des taux de réponse et d’assistance élevés,
en analysant continuellement l’efficacité
de ses campagnes promotionnelles.

La base de données de la société
est organisée autour d’une entité
client: la table Customers. Cette table
et deux autres – Promotions et
Conferences – définissent l’objet
Customer. La figure 1 montre les tables
et leurs champs constitutifs.

Les clients reçoivent de nombreuses
promotions pour de nombreux
événements et, après avoir reçu une promotion, soit ils l’ignorent soit
ils l’enregistrent et assistent à  l’événement
correspondant. Disons que votre
travail consiste à  examiner les « touchés
et ratés » promotionnels et à  déterminer
quelles caractéristiques prédisposent
les clients à  assister à 
l’événement en question. Quand vous
les connaîtrez, vous pourrez mieux cibler
les promotions d’événement suivantes.
Un ciblage précis diminue les
coûts promotionnels et vous permet
de mieux servir vos clients en leur offrant
les informations pertinentes pour
leurs centres d’intérêt. Une telle personnalisation
bâtit la fidélité durable
du client.

Pour déterminer les caractéristiques
des clients et des prospects les
plus susceptibles de répondre à  votre
offre promotionnelle, vous devez
d’abord regrouper et analyser les ensembles
de données contenant des réponses
et des non-réponses à  une ou
plusieurs offres. De plus, vous devez
constituer un ensemble de données
contenant suffisamment d’informations
distinctives pour vous aider à  estimer
la probabilité d’une réponse
d’après certaines caractéristiques.

Votre observation de la réussite ou
de l’échec des précédentes campagnes
de marketing de Conference Corp indique
que la probabilité de réponse est
fonction du type de travail du client, de
la taille de la firme, et de ses ventes annuelles.
Il vous semble aussi que les
taux de réponses varient d’après les caractéristiques
de la relation client : depuis
quand la personne est-elle cliente,
la présence à  des événements précédents
et autres. De plus, les managers
de Conference Corp ont observé que la
réponse semble être liée au type
d’offre, à  la remise, et aux politiques de
coupons, ainsi qu’au nombre de promotions
précédemment envoyées au
prospect visé.

Il est difficile de faire le tri de tous
ces prédicteurs potentiels pour trouver
la combinaison unique d’attributs
qui décrit le mieux le client le plus
suceptible de répondre, sauf si l’on dispose d’un algorithme de recherche
de profil automatisé. Comme je le démontre
plus loin, les arbres de décision
de datamining conviennent parfaitement
pour effectuer ce genre de recherche
de profil.

Téléchargez cette ressource

Livre blanc Sécurité et Stockage des documents

Livre blanc Sécurité et Stockage des documents

Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.

Data - Par iTPro.fr - Publié le 24 juin 2010