Je dois admettre un fait. Je faisais partie des personnes du monde des bases de données relationnelles qui ne s’intéressaient pas réellement à Analysis Services. Je pensais qu’un cube OLAP était le poste où travaillait un certain Oliver Lap du département de la comptabilité entre 8 h 00 et 17 h 00. Pour moi, les dimensions étaient réservées aux physiciens et aux adeptes de la série La quatrième dimension.Mon point de vue s’est modifié il y a quelques années, lorsque j’ai appris en quoi Analysis Services pouvait être avantageux, pour moi comme pour mes clients. Si vous vous focalisez depuis toujours sur les bases de données relationnelles, vous allez peut-être changer d’avis en essayant la CTP (Community Technical Preview) analyse décisionnelle (en anglais BI (Business Intelligence)) fantastiques proposées par SSIS (SQL Server Integration Services) pour vos applications relationnelles. Deux nouvelles tâches de transformation vous simplifieront la vie lorsque vous travaillez sur des données incohérentes et une tâche de data mining vous permettra de créer un modèle de données s’adaptant aux évolutions de l’activité.
Ces fonctionnalités ne requièrent pas une grosse infrastructure d’entrepôt de données ou de cube OLAP. Il vous suffit d’avoir SQL Server 2005 et d’être prêt à tester quelque chose de nouveau.
Développez votre connaissance de l’analyse décisionnelle

Commençons par examiner deux tâches de transformation SSIS. Si vous êtes resté en dehors du circuit, SSIS est le successeur de DTS (Data Transformation Services) et, non seulement cet outil accomplit la même fonction que son prédécesseur, à savoir déplacer des données, mais il offre encore plus de possibilités, est plus simple à utiliser, réduit le travail de codage et est extrêmement rapide.
Les tâches de transformation examinées ici sont les « recherches floues » (Fuzzy Lookup) et les « groupements flous » (Fuzzy Grouping). Comme leur nom leur suggère, ces tâches permettent de réaliser des opérations de recherche et de regroupement sans nécessiter une correspondance exacte des données, ce qui peut s’avérer utile si vous importez des données de systèmes propriétaires ou de champs de saisie de données non normalisés.
Recherche floue. La tâche Fuzzy Lookup prend des colonnes et recherche les valeurs dans une table de référence de flux de données SSIS. Elle ne recherche pas une correspondance exacte, mais travaille comme votre professeur préféré. Elle effectue des classements selon une courbe et donne des unités de valeur partielles. Elle recherche une correspondance entre les valeurs de colonne et les éléments dans la table.
Prenons un cas de figure dans lequel vous devez charger un fichier texte, illustré à la figure 1, à partir d’une table d’adresses d’un système propriétaire. Les éléments city (ville) et state (état) de l’adresse dans le système cible sont normalisés, de sorte que les combinaisons city et state sont stockées dans une table de recherche séparée. Malheureusement, les villes figurant dans le système propriétaire n’ont pas été validées. Par conséquent, l’établissement d’une correspondance entre une paire city/state et un enregistrement dans la table de recherche risque d’être ardu.
Entrez dans SSIS et accédez à la tâche Fuzzy Lookup. Vous créez le lot de la figure 2 en utilisant la programmation par glisser-déplacer. Il suffit de faire glisser des éléments de la boîte à outils, de les placer dans le flux de données et de définir leurs propriétés. Aucun codage n’est nécessaire. Ce lot récupère les données du fichier texte, effectue une recherche floue afin de trouver la clé étrangère pour la combinaison city/state, puis enregistre les informations dans la table Address de SQL Server.
Téléchargez cette ressource

Prédictions 2025 des menaces persistantes avancées
L'analyse et l'évolution du paysage des menaces persistantes avancées (APT) et des conséquences sur vos infrastructures IT. Découvrez la synthèse des prédictions, tendances et recommandations pour 2025 avec les experts Kaspersky.
Les articles les plus consultés
- L’utilisation des données pour survivre !
- Databricks lève 1 milliard de dollars !
- 9 défis de transformation digitale !
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- Les projets d’intégration augmentent la charge de travail des services IT
Les plus consultés sur iTPro.fr
- Quel impact d’une cyberguerre sur les organisations ?
- Menaces cyber sur le secteur énergétique européen !
- Les stratégies IA pour la survie de l’entreprise !
- Protégez l’accès non authentifié de vos réunions
- Télécommunications et durabilité : les défis d’une transition verte dans un secteur en mutation
