> Data > Développez votre connaissance de l’analyse décisionnelle

Développez votre connaissance de l’analyse décisionnelle

Data - Par Brian Larson - Publié le 24 juin 2010
email

Je dois admettre un fait. Je faisais partie des personnes du monde des bases de données relationnelles qui ne s’intéressaient pas réellement à Analysis Services. Je pensais qu’un cube OLAP était le poste où travaillait un certain Oliver Lap du département de la comptabilité entre 8 h 00 et 17 h 00. Pour moi, les dimensions étaient réservées aux physiciens et aux adeptes de la série La quatrième dimension.Mon point de vue s’est modifié il y a quelques années, lorsque j’ai appris en quoi Analysis Services pouvait être avantageux, pour moi comme pour mes clients. Si vous vous focalisez depuis toujours sur les bases de données relationnelles, vous allez peut-être changer d’avis en essayant la CTP (Community Technical Preview) analyse décisionnelle (en anglais BI (Business Intelligence)) fantastiques proposées par SSIS (SQL Server Integration Services) pour vos applications relationnelles. Deux nouvelles tâches de transformation vous simplifieront la vie lorsque vous travaillez sur des données incohérentes et une tâche de data mining vous permettra de créer un modèle de données s’adaptant aux évolutions de l’activité.
Ces fonctionnalités ne requièrent pas une grosse infrastructure d’entrepôt de données ou de cube OLAP. Il vous suffit d’avoir SQL Server 2005 et d’être prêt à tester quelque chose de nouveau.

Développez votre connaissance de l’analyse décisionnelle

Commençons par examiner deux tâches de transformation SSIS. Si vous êtes resté en dehors du circuit, SSIS est le successeur de DTS (Data Transformation Services) et, non seulement cet outil accomplit la même fonction que son prédécesseur, à savoir déplacer des données, mais il offre encore plus de possibilités, est plus simple à utiliser, réduit le travail de codage et est extrêmement rapide.

Les tâches de transformation examinées ici sont les « recherches floues » (Fuzzy Lookup) et les « groupements flous » (Fuzzy Grouping). Comme leur nom leur suggère, ces tâches permettent de réaliser des opérations de recherche et de regroupement sans nécessiter une correspondance exacte des données, ce qui peut s’avérer utile si vous importez des données de systèmes propriétaires ou de champs de saisie de données non normalisés.

Recherche floue. La tâche Fuzzy Lookup prend des colonnes et recherche les valeurs dans une table de référence de flux de données SSIS. Elle ne recherche pas une correspondance exacte, mais travaille comme votre professeur préféré. Elle effectue des classements selon une courbe et donne des unités de valeur partielles. Elle recherche une correspondance entre les valeurs de colonne et les éléments dans la table.

Prenons un cas de figure dans lequel vous devez charger un fichier texte, illustré à la figure 1, à partir d’une table d’adresses d’un système propriétaire. Les éléments city (ville) et state (état) de l’adresse dans le système cible sont normalisés, de sorte que les combinaisons city et state sont stockées dans une table de recherche séparée. Malheureusement, les villes figurant dans le système propriétaire n’ont pas été validées. Par conséquent, l’établissement d’une correspondance entre une paire city/state et un enregistrement dans la table de recherche risque d’être ardu.

Entrez dans SSIS et accédez à la tâche Fuzzy Lookup. Vous créez le lot de la figure 2 en utilisant la programmation par glisser-déplacer. Il suffit de faire glisser des éléments de la boîte à outils, de les placer dans le flux de données et de définir leurs propriétés. Aucun codage n’est nécessaire. Ce lot récupère les données du fichier texte, effectue une recherche floue afin de trouver la clé étrangère pour la combinaison city/state, puis enregistre les informations dans la table Address de SQL Server.

Téléchargez cette ressource

Livre blanc Sécurité et Stockage des documents

Livre blanc Sécurité et Stockage des documents

Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.

Data - Par Brian Larson - Publié le 24 juin 2010