> Data > SQL Server 2000 : Le modèle OIM

SQL Server 2000 : Le modèle OIM

Data - Par iTPro.fr - Publié le 24 juin 2010
email

Un groupe d'éditeurs et d'entreprises utilisatrices a formalisé les types de métadonnées pour les entrepôts de données. C'est devenu l'OIM (Open Information Model) Avant les efforts de normalisation de Microsoft, les éditeurs et la communauté informatique ne parvenaient guère à  se mettre d'accord sur le type de métadonnées qu'un entrepôt de données devait contenir.
Par la suite, Microsoft a entrepris de réunir les principaux éditeurs et les entreprises utilisatrices pour déterminer ces types de métadonnées. A l'instar du modèle objet pour une application, le modèle d'information pour un référentiel définit le genre de métadonnées stockées dans l'entrepôt de données, et la manière dont ces données sont organisées.

Ces efforts ont conduit à  la définition de l'OIM (Open Information Model). Celui-ci contient les définitions d'approximativement 300 types d'objets et des relations entre ces types d'objets. La documentation de ces types représente une tâche laborieuse ; le groupe a pour mission de définir et de documenter clairement chaque type ainsi que ses caractéristiques et relations nécessaires.
Etant donné que le modèle d'information définit les métadonnées en termes de types d'objets et de relations, la recherche d'une technologie de modélisation d'objets appropriée est la solution évidente. Le groupe a choisi UML (Unified Modeling Language) pour documenter et publier le modèle d'information. Le standard OIM constitue le langage commun pour décrire les informations contenues dans un entrepôt de données.

En juillet 1999, Microsoft a transféré la propriété du standard OIM à  la MDC (Meta Data Coalition), un organisme indépendant qui se consacre à  la création de normes communes facilitant l'échange d'informations entre systèmes (métadonnées). Au fur et à  mesure que la MDC va faire évoluer le modèle, elle va encourager et aider les autres éditeurs à  prendre en charge le standard OIM au sein de leurs outils respectifs. La MDC publie les formats XML (Extensible Markup Language) comme méthode d'échange de données entre différents outils utilisant le standard OIM. Ce dernier limite la complexité de l'extraction et de l'insertion des données de/dans Microsoft Repository et les outils d'autres éditeurs.

La version actuellement validée du standard OIM (initialement soumise par Microsoft et ses éditeurs partenaires) est la 1.0 ; une proposition de version 1.1 a été soumise en novembre 1999, et devrait en toute logique être validée en 2000. Les exemples et descriptions présentés dans le présent article s'appuient sur la version 1.1. Ces exemples nécessitent la version 3 de Microsoft Repository, disponible avec SQL Server 2000. La version 2 de Repository ne supporte pas les collections ni les propriétés héritées, que le standard OIM MDC utilise intensivement.
Le standard OIM couvre de nombreux domaines, dont :
· L'analyse et la conception d'UML, les extensions UML, les éléments génériques, les types de données communs et la modélisation entités-relations
· Objets et composants : description des composants
· Base de données et entrepôts de données : schémas de bases de données relationnelles, transformations de données, schémas OLAP, schémas de bases de données orientés enregistrements, schémas XML et définitions des rapports
· Ingénierie de processus de gestion : objectifs commerciaux, règles et processus, éléments organisationnels.
· Gestion de la connaissance : descriptions des connaissances et définitions sémantiques

D'un point de vue data warehousing, les schémas de bases de données relationnelles, les transformations de données et les modèles de schémas OLAP sont les plus appropriés. On peut télécharger chaque modèle en tant que fichier .mdl depuis le site Web de la MDC, puis utiliser un outil de conception comme Visual Modeler ou Rational Rose pour le visualiser.
Chaque objet figurant dans un référentiel peut avoir trois propriétés : un nom (255 caractères au maximum), une courte description (255 caractères au maximum) et des commentaires (de longueur pour ainsi dire illimitée). Ces zones, qui sont la source d'une grand

La plupart des entrepôts de données utilisent des bases de données relationnelles,
et la majeure partie des données d’un entrepôt proviennent de sources relationnelles.
Ainsi, ce modèle relationnel sert de description pour l’entrepôt de données et
de plusieurs systèmes sources alimentant l’entrepôt, dont les aspects les plus
importants sont les tables, les colonnes et les objets serveurs ou les catalogues.

Les données dans le schéma d’une base de données relationnelle SQL Server sont
habituellement peuplées par le scanner OLE DB fourni avec SQL Server 7.0. La figure
1 présente les composants de base permettant d’extraire ou de mettre à  jour des
informations d’une base de données relationnelle. La source de données représente
un serveur en termes SQL Server. Habituellement, il s’agit du nom de la machine
serveur.
Pour d’autres systèmes de gestion des bases de données, la source de données représente
le nom renvoyé par le provider OLE DB. Il s’agit habituellement du nom de la source
de données. Sur chaque source de données, il existe un ensemble de catalogues
déployés ou de bases de données SQL Server. Pour accéder aux catalogues à  partir
des sources de données, suivez la collection DeployedCatalogs. Les catalogues
contiennent les schémas accessibles en suivant la collection Schemas. Les schémas
contiennent des tables, accessibles par le biais de la collection Tables. Ensuite
viennent les colonnes dans les tables, que l’on accède au moyen de la collection
héritée Columns.
Puisque le standard OIM est basé sur la norme UML, les interfaces peuvent hériter
d’autres interfaces en utilisant le concept de l’héritage de la modélisation d’objets
et de la norme UML (l’interface hérite de toutes les propriétés et des relations
de l’interface héritée). Tables hérite de ColumnSet, qui contient la collection
Columns. On peut extraire le type de données de la colonne à  partir de la collection
DataType.

Le diagramme présente également un héritage d’autres éléments. Même si on n’a
pas besoin de connaître ces informations pour utiliser les modèles, les utilisateurs
avancés pourraient par exemple en avoir besoin pour enrichir le modèle. La documentation
MDC inclut une spécification complète de ce modèle, y compris les éléments supplémentaires
tels que les index, l’intégrité référentielle et les procédures cataloguées.

Téléchargez cette ressource

Livre blanc Sécurité et Stockage des documents

Livre blanc Sécurité et Stockage des documents

Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.

Data - Par iTPro.fr - Publié le 24 juin 2010