Le big data par la pratique
Le traitement massif de données se prête d'abord à la recommandation et à la segmentation client
D'énormes volumes de données, des informations peu structurées et des analyses réalisées en quasi temps réel. Voilà résumé le triptyque du big data, le dernier concept à la mode qui oscille entre réelles avancées et reconditionnement de concepts existants, notamment dans le décisionnel. Le big data est à la mode, car il promet d'effectuer de nouveaux types d'analyse. Premier débouché : la recommandation, un terrain quasi vierge. Ainsi eHarmony, site de rencontres américain client d'Amazon, compare et rapproche des profils de célibataires en s'appuyant sur 28 critères. Cela laisse entrevoir des combinaisons presque infinies. “ Avec les bases de données traditionnelles, eHarmony se limitait à l'analyse de quelques critères, explique Werner Vogels, directeur technique d'Amazon.com. Avec les seules bases relationnelles, on se coupait de nombreuses opportunités. Pour créer de nouvelles analyses, il fallait retoucher la structure de la base, ce qui en décourageait plus d'un. ”La solution passe par la plate-forme open source Hadoop. Comme la plupart des grands noms du web, Google ou Amazon justement, eHarmony s'est rallié à ce système distribué de calcul adapté aux très gros volumes de fichiers. Hadoop lui sert également à rapprocher sémantiquement les textes saisis librement par les célibataires.Autre vocation du big data, selon ses partisans : la segmentation client, surtout quand elle implique des données variées et volumineuses (logs, graphe social…). “ Un de nos clients spécialisé dans le jeu sur Facebook voulait déceler le profil type des joueurs prêts à basculer en mode payant, explique Romain Chaumais, PDG d'Ysance. Or, avec 140 amis en moyenne par joueur, un million et demi de joueurs et 50 millions d'interactions quotidiennes entre eux, les calculs nécessaires sont énormes. Seul Hadoop peut les réaliser. ”
Votre opinion