BFM Business
Services

Laurent Donnay (Accenture) : " le cloud, le compagnon idéal pour mener à bien les opérations Big Data "

Laurent Donnay, Responsable Architecture et Innovation chez Accenture explique comment combiner les technologies cloud et big data.

Laurent Donnay, Responsable Architecture et Innovation chez Accenture explique comment combiner les technologies cloud et big data. - -

Élasticité, simplicité, robustesse, le cloud semble tout indiqué pour analyser les grands volumes de données. Laurent Donnay, responsable Architecture et innovation chez Accenture, compare les différentes approches possibles.

Comment les entreprises peuvent elles s’appuyer sur les technologies cloud pour déployer des des traitements massifs de données façon Big Data ?

Chez Accenture nous distinguons trois approches pour utiliser les technologies Big Data en mode cloud : l’IaaS, le PaaS et l’AaaS. L’Infrastructure as a Service (IaaS) offre de grandes capacités matérielles (l'entreprise loue des capacités de calcul, de stockage…) prêtes à l’emploi pour un budget raisonnable et maîtrisé. Et si l’entreprise n’a pas de visibilité sur les volumes et les besoins, l’infrastructure s’adapte, et seul ce qui est utilisé est facturé. Une bonne solution pour les entreprises ayant peu de maturité sur la gouvernance de leurs données et les besoins en infrastructure. Plutôt rare chez nos clients.

Installée sur l’IaaS, la PaaS (Platform as a Service) intègre une pile logicielle de type Hadoop, les logiciels de gestion, de traitement et d'administration (le middleware), les bases de données et un ensemble de connecteurs pour que tous ces systèmes dialoguent ensembles. L’entreprise doit juste disposer de compétences sur la partie haute de Big Data, c'est à dire que l'organisation des données. Elle s'appuie alors sur des dictionnaire de données, des référentiels, et des outils de visualisations et de mises en forme pour présenter de façon compréhensible les données (graphiques, camemberts, etc). 

Mais existe-t-il des solutions cloud prêtes à l’emploi pour le Big Data ?

Effectivement, c’est la troisième approche. En mode AaaS (Analytics as a Service), tout est déjà installé et préparamétré, et l’entreprise n’a plus qu’à injecter ses données. Même les rapports sont prédéfinis. Bien entendu, il lui est toujours possible de modifier ces éléments si elle le souhaite.

Existe-t-il des tests comparatifs entre ces différentes approches ?

Accenture a mené un comparatif Big Data entre une infrastructure sur site (on premise) et une solution PaaS Hadoop. Il s’agissait de modéliser un environnement impliquant 24 nœuds de calcul, et 52 téraoctets (To) de données pour un investissement de 22 000 dollars par an. Trois types de traitements ont été considérés : l’analyse de logs (24 To), un moteur de recommandation (50 000 items et 300 millions de recommandations) et du classement documentaire (10 To de documents surtout bureautiques).

La solution Hadoop as a Service offrait choix de plus de 40 configurations matérielles différentes. Et surtout, les mesures brutes avec le même budget ont révélé des performances doublées sur l’analyse de logs et quadruplées sur les recommandations (avec un gain de 50%), et le même ordre de gains sur la classification documentaire. Après optimisation technique, les gains en performances ont été améliorés de 80% !

José Diz