> Data > Analyse décisionnelle : gagnez le gros lot

Analyse décisionnelle : gagnez le gros lot

Data - Par Rodney Landrum - Publié le 24 juin 2010
email

Depuis quelque temps, la majorité des grandes entreprises se tournent vers des plates-formes d’SQL Server 2005 pour essayer de gagner à la loterie puisse fort ressembler à une simple activité récréative, vous serez capable de transposer directement ces techniques à vos projets métier, comme je l’ai fait pour de nombreux scénarios de sécurité sociale. Bien souvent, les exercices amusants constituent la meilleure approche pour maîtriser des outils et technologies intimidants. En outre, autre avantage connexe, cet article pourrait tout simplement vous rendre terriblement riche.

Analyse décisionnelle : gagnez le gros lot

La première étape de l’analyse des données a consisté à charger celles-ci dans les tables. Selon le niveau de transformation nécessaire des données, le remplissage des tables de base de données avec des données source peut être des plus simples, grâce aux fonctions d’importation intégrées de l’outil SQL Server Management Studio de SQL Server 2005, ou particulièrement ardu si vous retenez l’approche SQL Server Integration Services (SSIS).

Pour les besoins de mon projet, j’ai opté pour la voie facile, à savoir importer les données de la loterie dans une table unique à sept champs d’une base de données que j’ai intitulée WinBig. Cette table, que j’ai appelée lottery_load, comportait simplement un champ servant à stocker la date du tirage (DrawDate) et six champs numériques (N1 à N6) contenant les numéros de loterie individuels. J’ai été capable de trouver le dataset complet de tous les tirages du loto de Florides (Etats-Unis) entre le 7 mai 1998 et le 27 mai 2006, soit un total de 1287 tirages. (Je ne suis pas certain que tous les états américains disposant de loteries aient ce type de liste sur leur site Web.)

Après certaines adaptations afin que la liste des tirages HTML entre dans un dataset limité des sept champs dont j’avais besoin, j’ai exécuté la procédure de l’Assistant Importation et Exportation SQL Server (SQL Server Import and Export Wizard) en cliquant avec le bouton droit de la souris sur la base de données, puis en sélectionnant Tâches (Tasks) et Importer des données (Import Data).

Une fois l’opération effectuée, j’avais ma source de données pour le projet Analysis Services et étais prêt à découvrir les trésors enfouis dans les profondeurs des chiffres. (Je dois noter que le processus d’extraction, de transformation et de chargement des données de la source vers la destination, comme dans un scénario d’entrepôt de données, est généralement la tâche la plus longue d’un projet Analysis Services, en particulier lorsque vous mettez en place des modèles d’exploration de données, car vous souhaitez avoir des données aussi précises que possible.)

L’étape suivante a consisté à effectuer toutes les analyses de données dans BIDS (Business Intelligence Development Studio), une application d’interface Visual Studio 2005 fournie gratuitement avec SQL Server 2005. J’ai créé un nouveau projet Analysis Services en sélectionnant File, New, Project. Un des types de projets sélectionnables est Analysis Services Project. J’ai nommé le projet Lottery Prediction. Dans l’Explorateur de solutions (Solution Explorer) illustré à la figure 1, vous pouvez voir tous les objets disponibles à créer. Avant de pouvoir créer une structure d’exploration de données (Mining Structure), j’avais besoin de créer deux de ces objets: Source de données (Data Source) et Vues de source de données (Data Source Views).

Téléchargez cette ressource

Travail à distance – Guide IT et Métiers

Travail à distance – Guide IT et Métiers

Le travail à distance met à l'épreuve la maturité numérique des entreprises en termes de Cybersécurité, d'espace de travail, de bien-être des collaborateurs, de communication et gestion de projet à distance. Découvrez, dans ce nouveau Guide Kyocera, quels leviers activer prioritairement pour mettre en place des solutions de travail à domicile efficaces, pérennes et sécurisées.

Data - Par Rodney Landrum - Publié le 24 juin 2010