BFM Business
Services

Le Big Data impose aux entreprises de revoir leurs méthodes de stockage de documents

Lorsqu’elles bascule vers de projets liés au Big Data, les entreprises doivent adapté un système de stockage dit « scale out ».

Lorsqu’elles bascule vers de projets liés au Big Data, les entreprises doivent adapté un système de stockage dit « scale out ». - Orange

Le Big Data requiert un système de stockage évolutif. Les entreprises veulent pouvoir prévoir à l'avance les performances de leur infrastructure, selon le volume et la densité des données qu'elles vont stocker.

Qui dit big Data, dit collecte d’un important volume de données structurées (bases de données clients, produits, RH…) et non structurées (images, vidéos, audio, textes…). Ces dernières représentent le plus gros défi pour les entreprises car elles sont disponibles dans de nombreux formats et leur croissance n’est pas maitrisable, notamment lorsqu’elles sont générées par le grand public, sur Internet. "Il est donc indispensable de définir une nouvelle approche de gestion des données, en s’appuyant sur une architecture de stockage dite scale out, explique Sébastien Verger, directeur technique d’EMC France. De cette manière, le système de stockage peut être augmenté par simple ajout de blocs logiques".

Chacun de ces blocs logiques est composé de puissance de calcul, de rapidité dans le traitement des saisies et des affichages d'informations et de capacité de stockage. Armé de ces paramètres, un admistrateur est capable de prévoir les performances de son infrastructure de stockage. En effet, dans une infrastructure de stockage traditionnelle, dite scale up, l’évolution de l’infrastructure de stockage passe par un simple ajout de volume de stockage. Elle ne tient pas compte du coup de l’impact de cet ajout de données sur les performances de l’infrastructure.

Utiliser un protocole commun de gestion des données

Cette infrastructure compose alors un lac de données, constitué de l’ensemble des informations brutes collectées et créées par l’entreprise. Leur analyse et, surtout, leur valorisation impose l’utilisation du protocole Hadoop, qui permet d’appliquer aux informations, structurées, ou non, quel que soit son protocole, une requête de type base de données. C’est alors que les données peuvent être envoyées vers des outils de décisionnel pour en extraire la valeur.

Eddye Dibar