Editeur de logiciels, depuis 1993, spécialiste de la gestion des données et du décisionnel qui n’a évidemment pas de secret pour l’entreprise, Informatica a étendu son offre avec des solutions de qualité et de gouvernance des données, des outils dédiés métiers… Mais revenons au Big Data avec Edouard Guérin, expert Big Data chez Informatica. Comment les DSI peuvent-ils assurer la cohérence de leur SI ? Et si le Data Catalog influençait la donne ...
Big Data : comment maîtriser son patrimoine informationnel

Volume de données & cas d’usage
« Au-delà de l’IT classique, on s’adresse beaucoup plus aux métiers » souligne d’emblée Edouard Guérin. Jusqu’ici les données étaient stockées et pas vraiment accessibles, mais le rapport à la donnée a fondamentalement changé avec le temps.
« Auparavant, il y avait une distinction nette entre producteurs et consommateurs de la donnée, aujourd’hui avec les nouvelles technologies, le stockage et l’accès plus rapide notamment, chacun est producteur et consommateur de la donnée » nous rappelle Edouard Guérin. Pas de doute, le Big Data démocratise l’accès aux données…
Face à ce bouleversement majeur, les volumes de données sont énormes et les cas d’usage sont multiples, prédiction des détections de pannes dans le monde industriel ou suggestion de nouvelles offres par rapport à l’usage … Informatica répond à ces problématiques avec « la construction d’un datalake et la gestion du Système d’Information dans sa globalité ».
Avoir une vision d’ensemble est primordial pour savoir d’où viennent les données, comment elles sont constituées, qui en est le responsable « afin de proposer le bon service aux consommateurs internes mais aussi externes de l’entreprise ». C’est ici qu’interviennent les notions de data préparation et de gouvernance de la donnée sur le Big Data.
L’atout du Data Catalog
On parle du « catalogage » des données, en d’autres termes, il est impératif de faire une cartographie des données pour savoir « ce qui existe dans le SI ». « Si on veut proposer l’accès aux données, encore faut-il en avoir un inventaire et donc en avoir un catalogue » explique Edouard Guérin.
Avec Enterprise Data Catalog, Informatica collecte ainsi les métadonnées du SI (gestion, production, RH …) pour obtenir une vision globale des données dans l’entreprise, un moteur de recherche permet de retrouver l’information très rapidement, et de préciser « d’où elle vient, où elle va ».
La force de proposition réside, ensuite, dans la qualification des données (forte ou faible valeur ajoutée) « nous sondons les données pour en déterminer la qualité, la valeur et les croiser avec d’autres jeux de données présents dans le SI ». L’aspect catalogue est tout simplement la base, notamment pour savoir si les données sont réutilisables.
L’indépendance fait la force d’Informatica qui « peut assurer une couverture la plus large du marché, ce qui permet un accès à tous types de métadonnées à la fois dans le datalake Hadoop et celles à l’extérieur ». Le Data Catalog est exhaustif « 360° avec tous types de technologies ». De plus, « nous relions l’ensemble à un glossaire métier pour avoir une vision synthétique de l’inventaire du patrimoine informationnel avec, à la fois, la vision technique et la vision métier ».
Le libre-service !
L’accès aux données est démocratisé au travers d’une plate-forme libre-service qui permet de préparer les données, pour qu’elles soient accessibles par l’utilisateur lui-même.
En effet, face à la multiplicité des formats, « les données ne sont pas toujours présentables pour l’utilisateur final, ici notre rôle est de restructurer l’information qui ne l’est pas, d’une part, et de croiser les informations les unes avec les autres pour apporter une vraie valeur ajoutée » commente Edouard Guérin.
Il ne vous reste plus qu’à cataloguer, cartographier et auditer !
Téléchargez cette ressource

Prédictions 2025 des menaces persistantes avancées
L'analyse et l'évolution du paysage des menaces persistantes avancées (APT) et des conséquences sur vos infrastructures IT. Découvrez la synthèse des prédictions, tendances et recommandations pour 2025 avec les experts Kaspersky.
Les articles les plus consultés
- Databricks lève 1 milliard de dollars !
- 10 grandes tendances Business Intelligence
- Stockage autonome, Evolutivité & Gestion intelligente, Pure Storage offre de nouvelles perspectives aux entreprises
- Intelligence Artificielle : DeepKube sécurise en profondeur les données des entreprises
- Les projets d’intégration augmentent la charge de travail des services IT
Les plus consultés sur iTPro.fr
- Quel impact d’une cyberguerre sur les organisations ?
- Menaces cyber sur le secteur énergétique européen !
- Les stratégies IA pour la survie de l’entreprise !
- Protégez l’accès non authentifié de vos réunions
- Télécommunications et durabilité : les défis d’une transition verte dans un secteur en mutation
