RainStor, la base de données qui transforme le big data en small data

L'éditeur californien commercialise une base de données Hadoop capable de diviser par 40 le volume de données injectées tout en proposant une double méthode d'analyse SQL-MapReduce.
Le meilleur des deux mondes, voilà ce que promet, depuis quelques mois, RainStor aux entreprises qui souhaitent se lancer dans l'aventure du big data au travers d'une plate-forme Hadoop. A savoir : pouvoir réaliser des analyses de grosses masses données en langage SQL ou au travers d'un calcul distribué MapReduce. Et cela tout en réduisant au passage le volume de données brutes injectées de manière considérable. Comment est-ce possible ?

Avec sa solution Big Data Analytics on Hadoop (BDAH), RainStor cible en réalité les données semi-structurées, comme les logs des opérateurs mobiles ou les données de transactions financières. Elles ne sont pas stockées en base de données, mais disposent néanmoins d'une certaines structure logique et intrinsèque. Déployé sur les noeuds massivement parallèles d'une plate-forme Hadoop, BDAH peut lire des millions d'enregistrements et identifier à l'intérieur de ces derniers les motifs d'information sous-jacents qui seront stockés dans des arbres de données. Ce qui permet d'éliminer les redondances (voir schéma) et par conséquent, selon l'éditeur, de diviser par 40 la quantité de données totale stockée.
Réduire les coûts opérationnels
Cette base de données qui en résulte peut ensuite être interrogée par une requête SQL ou être soumise à un calcul MapReduce. « Cela dépend du type de requête. Pour une analyse simple, SQL est la bonne solution car beaucoup plus rapide. Pour les analyses plus complexes, qui nécessitent une vraie transformation des données, il faut opter pour MapReduce », explique Mark Cusack, architecte en chef chez RainStor. Revers de la médaille : les enregistrements de cette base un peu spéciale ne peuvent plus être modifiés. Ce n'est donc pas une base de données opérationelle, mais une base statique dédiée à l'analyse.
Avec la solution BDAH, RainStor cible les opérateurs télécoms, les banques, les réseaux électriques intelligents, etc. Bref, toute entreprise qui génère continuellement beaucoup de données. « L'argument commercial principal est la réduction des coûts obtenue par une plus grande rapidité de traitement et un moindre stockage », souligne John Bantleman, PDG de RainStor. A ce titre, l'éditeur promet une réduction des coûts opérationnels de 90 %.
Votre opinion