> Data > Les solutions Microsoft pour les projets Big Data / NoSQL

Les solutions Microsoft pour les projets Big Data / NoSQL

Data - Par Laurent Marzouk - Publié le 20 novembre 2012
email

Les phénomènes Big Data / NoSQL ne cessent de prendre de l’ampleur, et constituent probablement l’un des nouveaux enjeux majeurs de demain.

Les solutions Microsoft pour les projets Big Data / NoSQL

Après un bref rappel des concepts présentés le mois dernier et des solutions décisionnelles proposées par Microsoft pour gérer ces gisements de données au sein de l’entreprise, nous détaillons ce mois-ci les solutions disponibles en mode Cloud ou Grid.

Lire aussi : Big Data – Les enjeux business de demain
Les solutions Microsoft en matière de Big Data

Nous abordons également les solutions de collecte et d’intégration des données et les principaux projets Big Data sur lesquels travaille Microsoft, pour conclure sur les capacités d’intégration des outils BI de la suite Microsoft avec ces différentes solutions, sans lesquelles les utilisateurs ne seraient pas en mesure d’exploiter ces immenses gisements de données.

On peut définir la notion de Big Data comme un ensemble de données dont la volumétrie est supérieure à celles que sont capables de collecter, stocker et traiter dans un intervalle de temps raisonnable les solutions matérielles et logicielles classiquement utilisées pour ce type de tâche. La plupart des analystes s’accordent à fixer un seuil minimum de quelques dizaines de téraoctets (1012), les maxima n’étant pas fixés mais pouvant atteindre aujourd’hui plusieurs pétaoctets de données (1015), et probablement plus à l’avenir.

Le mois dernier, nous avons vu que le paradigme du Big Data était en fait caractérisé par quatre paramètres liés aux données (les 4 « V ») : leur Volume bien sûr, mais également leur Vélocité (vitesse à laquelle elles sont générées et doivent potentiellement être traitées, ainsi que leur durée de validité), leur Variété (les données peuvent être disponibles dans des formats structurés, semi-structurés voire non structurés) et leur Versatilité (les enregistrements de certains jeux de données peuvent contenir un nombre d’attributs variables, et être de fait interprétés de manière différente).

Parmi les sources de données génératrices de larges volumes de données, on peut par exemple citer les fichiers Logs de différents systèmes (Logs de sécurité des Firewall ou Proxy, Logs réseaux, activité des internautes sur les sites Web (clickstreams), etc.), les capteurs réseaux intelligents, les capteurs RFID, les fichiers audio et vidéo, les textes issus des réseaux sociaux, forums ou Blogs… la liste est longue !

L’enjeu pour les entreprises est simple : être capable d’intégrer et analyser aussi rapidement que possible des volumes de données de plus en plus importants issus de sources multiples et de formats variés, afin d’optimiser l’efficacité de leurs campagnes marketing en ciblant mieux leurs clients, de mieux comprendre le comportement de ces derniers à l’achat (quels sont les critères déclencheurs), ou encore offrir de nouveaux services à  valeur ajoutée à leurs clients, et ainsi conserver un avantage compétitif face à la concurrence.

Les solutions permettant d’adresser une problématique Big Data sont essentiellement de trois types : Décisionnelles (bases de données, cubes OLAP), Cloud Computing (clusters de machines offrant des services de stockage hiérarchique ou relationnel en mode hébergé) et Grid Computing (basée sur le type Cloud mais fournissant des services spécialisés pour les calculs intensifs et le traitement des données).

Téléchargez cette ressource

Travail à distance – Guide IT et Métiers

Travail à distance – Guide IT et Métiers

Le travail à distance met à l'épreuve la maturité numérique des entreprises en termes de Cybersécurité, d'espace de travail, de bien-être des collaborateurs, de communication et gestion de projet à distance. Découvrez, dans ce nouveau Guide Kyocera, quels leviers activer prioritairement pour mettre en place des solutions de travail à domicile efficaces, pérennes et sécurisées.

Data - Par Laurent Marzouk - Publié le 20 novembre 2012