Un groupe d'éditeurs et d'entreprises utilisatrices a formalisé les types de métadonnées
pour les entrepôts de données. C'est devenu l'OIM (Open Information Model)
Avant les efforts de normalisation de Microsoft, les éditeurs et la communauté
informatique ne parvenaient guère à se mettre d'accord sur le type de métadonnées
qu'un entrepôt de données devait contenir.
Par la suite, Microsoft a entrepris de réunir les principaux éditeurs et les entreprises
utilisatrices pour déterminer ces types de métadonnées. A l'instar du modèle objet
pour une application, le modèle d'information pour un référentiel définit le genre
de métadonnées stockées dans l'entrepôt de données, et la manière dont ces données
sont organisées.
Ces efforts ont conduit à la définition de l'OIM (Open Information Model). Celui-ci
contient les définitions d'approximativement 300 types d'objets et des relations
entre ces types d'objets. La documentation de ces types représente une tâche laborieuse
; le groupe a pour mission de définir et de documenter clairement chaque type
ainsi que ses caractéristiques et relations nécessaires.
Etant donné que le modèle d'information définit les métadonnées en termes de types
d'objets et de relations, la recherche d'une technologie de modélisation d'objets
appropriée est la solution évidente. Le groupe a choisi UML (Unified Modeling
Language) pour documenter et publier le modèle d'information. Le standard OIM
constitue le langage commun pour décrire les informations contenues dans un entrepôt
de données.
En juillet 1999, Microsoft a transféré la propriété du standard OIM à la MDC (Meta
Data Coalition), un organisme indépendant qui se consacre à la création de normes
communes facilitant l'échange d'informations entre systèmes (métadonnées). Au
fur et à mesure que la MDC va faire évoluer le modèle, elle va encourager et aider
les autres éditeurs à prendre en charge le standard OIM au sein de leurs outils
respectifs. La MDC publie les formats XML (Extensible Markup Language) comme méthode
d'échange de données entre différents outils utilisant le standard OIM. Ce dernier
limite la complexité de l'extraction et de l'insertion des données de/dans Microsoft
Repository et les outils d'autres éditeurs.
La version actuellement validée du standard OIM (initialement soumise par Microsoft
et ses éditeurs partenaires) est la 1.0 ; une proposition de version 1.1 a été
soumise en novembre 1999, et devrait en toute logique être validée en 2000. Les
exemples et descriptions présentés dans le présent article s'appuient sur la version
1.1. Ces exemples nécessitent la version 3 de Microsoft Repository, disponible
avec SQL Server 2000. La version 2 de Repository ne supporte pas les collections
ni les propriétés héritées, que le standard OIM MDC utilise intensivement.
Le standard OIM couvre de nombreux domaines, dont :
· L'analyse et la conception d'UML, les extensions UML, les éléments génériques,
les types de données communs et la modélisation entités-relations
· Objets et composants : description des composants
· Base de données et entrepôts de données : schémas de bases de données relationnelles,
transformations de données, schémas OLAP, schémas de bases de données orientés
enregistrements, schémas XML et définitions des rapports
· Ingénierie de processus de gestion : objectifs commerciaux, règles et processus,
éléments organisationnels.
· Gestion de la connaissance : descriptions des connaissances et définitions sémantiques
D'un point de vue data warehousing, les schémas de bases de données relationnelles,
les transformations de données et les modèles de schémas OLAP sont les plus appropriés.
On peut télécharger chaque modèle en tant que fichier .mdl depuis le site Web
de la MDC, puis utiliser un outil de conception comme Visual Modeler ou Rational
Rose pour le visualiser.
Chaque objet figurant dans un référentiel peut avoir trois propriétés : un nom
(255 caractères au maximum), une courte description (255 caractères au maximum)
et des commentaires (de longueur pour ainsi dire illimitée). Ces zones, qui sont
la source d'une grand
SQL Server 2000 : Le modèle OIM
La plupart des entrepôts de données utilisent des bases de données relationnelles,
et la majeure partie des données d’un entrepôt proviennent de sources relationnelles.
Ainsi, ce modèle relationnel sert de description pour l’entrepôt de données et
de plusieurs systèmes sources alimentant l’entrepôt, dont les aspects les plus
importants sont les tables, les colonnes et les objets serveurs ou les catalogues.
Les données dans le schéma d’une base de données relationnelle SQL Server sont
habituellement peuplées par le scanner OLE DB fourni avec SQL Server 7.0. La figure
1 présente les composants de base permettant d’extraire ou de mettre à jour des
informations d’une base de données relationnelle. La source de données représente
un serveur en termes SQL Server. Habituellement, il s’agit du nom de la machine
serveur.
Pour d’autres systèmes de gestion des bases de données, la source de données représente
le nom renvoyé par le provider OLE DB. Il s’agit habituellement du nom de la source
de données. Sur chaque source de données, il existe un ensemble de catalogues
déployés ou de bases de données SQL Server. Pour accéder aux catalogues à partir
des sources de données, suivez la collection DeployedCatalogs. Les catalogues
contiennent les schémas accessibles en suivant la collection Schemas. Les schémas
contiennent des tables, accessibles par le biais de la collection Tables. Ensuite
viennent les colonnes dans les tables, que l’on accède au moyen de la collection
héritée Columns.
Puisque le standard OIM est basé sur la norme UML, les interfaces peuvent hériter
d’autres interfaces en utilisant le concept de l’héritage de la modélisation d’objets
et de la norme UML (l’interface hérite de toutes les propriétés et des relations
de l’interface héritée). Tables hérite de ColumnSet, qui contient la collection
Columns. On peut extraire le type de données de la colonne à partir de la collection
DataType.
Le diagramme présente également un héritage d’autres éléments. Même si on n’a
pas besoin de connaître ces informations pour utiliser les modèles, les utilisateurs
avancés pourraient par exemple en avoir besoin pour enrichir le modèle. La documentation
MDC inclut une spécification complète de ce modèle, y compris les éléments supplémentaires
tels que les index, l’intégrité référentielle et les procédures cataloguées.
Téléchargez cette ressource
Livre blanc Sécurité et Stockage des documents
Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.
Les articles les plus consultés
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- 9 défis de transformation digitale !
- Les projets d’intégration augmentent la charge de travail des services IT
- 10 grandes tendances Business Intelligence
- ActiveViam fait travailler les data scientists et les décideurs métiers ensemble