' A gestion de la qualité des données est un de nos principaux soucis. La qualité de nos référentiels clients et fournisseurs représente une fonction clé pour nous ', assure Justin Ziegler, DSI et fondateur de PriceMinister.com, un site de mise en relation de vendeurs et d'acheteurs de biens neufs et d'occasion. Pour la plupart des sociétés dont l'activité repose sur internet, les données clients représentent une mine d'or, et leur gestion un véritable casse-tête. Pour une raison simple : un contrôle incomplet sur ces informations. C'est l'internaute, en effet, qui s'inscrit dans la base de données clients sans s'embarrasser d'un quelconque souci de qualité. Charge à l'exploitant du site de nettoyer et de qualifier ses fichiers. Observons toutefois que la gestion des catalogues produits, maîtrisée de bout en bout par les entreprises, se révèle tout aussi problématique. Car s'il existe bien des référentiels, ils ne satisfont pas exactement les besoins.Les entreprises web ont donc mis sur pied des équipes ?" de taille importante au regard de leur effectif ?" vouées à la constitution et à l'entretien de leurs catalogues. Et pas question de négliger ces tâches, les conséquences seraient lourdes, tant en termes de gestion que sur la qualité du service rendu aux usagers et, donc, sur le chiffre d'affaires. Ces sociétés cherchent des solutions, conscientes de la montée en puissance de ces enjeux, et montrent, en toutes circonstances, la volonté de s'adapter. Car les solutions miracles n'existent pas.
' Nous réalisons 70 % de notre chiffre d'affaires via internet, nos données clients proviennent de l'extérieur de notre système d'information ', déclare Denis Mennesson, DSI de LDLC, un site de commerce électronique de produits high-tech. C'est le client qui entre lui-même ses coordonnées et non un salarié de l'entreprise. A l'arrivée, des doublons ainsi que des approximations.
' Un client peut s'inscrire plusieurs fois, créer plusieurs comptes ou, pour un nom donné, il peut exister plusieurs clients différents. Nous n'avons pas vraiment le moyen de savoir ', regrette Denis Mennesson. Justin Ziegler affronte les mêmes difficultés :
' Comment faire pour identifier des clients ayant ouvert plusieurs comptes chez nous ? Nous nous fondons sur des adresses de courrier électronique. 'Articuler la base de données clients et le catalogue de produits
Les entreprises actives sur internet rencontrent d'autres joyeusetés comme l'inversion du nom et du prénom, les adresses erronées ou incomplètes, sources d'erreur ou de retard dans les livraisons. Sans oublier l'insatisfaction du client, qu'il faut ensuite gérer. Si les problèmes de logistique ne sont pas forcément de leur fait, ces sociétés ont intérêt à maintenir la qualité de leurs fichiers de clientèle.
' Une grande part de notre activité consiste à organiser la concurrence entre vendeurs. Une autre est d'animer une base de membres, de cibler des offres de service en fonction de comportements d'achat ou de centres d'intérêts identifiés, expose Justin Ziegler.
Il serait préjudiciable pour l'efficacité de nos campagnes de marketing qu'un courriel à destination d'un gros vendeur soit adressé à un utilisateur n'ayant jamais mis en vente quoi que ce soit, et vice versa. 'Comme pour tout système d'information digne de ce nom, le plus important demeure l'articulation de la base de données clients et du catalogue de produits
' Un client enregistré dans notre base, c'est un identifiant rattaché à une commande d'un ou plusieurs articles ', indique Denis Mennesson. Aussi le système de LDLC est-il organisé autour de deux référentiels. Le premier, interne, sert à gérer le catalogue ainsi que les clients professionnels qui ne passent pas par internet, et le second, externe, les clients qui s'inscrivent sur le web.
' A un instant T, quand une commande est validée, le référentiel interne fait foi. Un client web enregistré est basculé sur ce dernier ', explique Denis Mennesson. Ce qui semble aujourd'hui d'une logique à toute épreuve n'a pas toujours été d'actualité chez ce commerçant en ligne.
' Le catalogue de produits a été rattaché au référentiel interne en 2005. Auparavant, il dépendait du référentiel web. Nous nous sommes aperçu que nous allions au-devant de gros problèmes, et nous avons modifié notre architecture ', rapporte le DSI.Chez PriceMinister, la brique OLTP (On Line Transaction Processing) qui gère les transactions entre vendeurs et acheteurs forme l'élément central du système d'information.
' Elle est alimentée par des flux de données en provenance des vendeurs et des utilisateurs ', rappelle Justin Ziegler. Et là commencent les difficultés. Un vendeur va devoir identifier dans la base de données mise à sa disposition par PriceMinister le produit qu'il souhaite commercialiser.
' Pour des articles similaires, mais pas exactement identiques, comme les différentes éditions d'un même livre ou un même modèle de voiture, avec juste une option qui diffère, doit-on les présenter comme identiques ou comme distincts ? interroge Justin Ziegler.
Et comment reconnaître deux produits identiques, mais à l'orthographe différente, car décrits par deux vendeurs différents ? ' Ces questions sont loin d'être anodines. Pour le service rendu à l'utilisateur d'abord, celui-ci réclamant les informations les plus précises possible sur les produits qu'il recherche. Et pour l'analyse des statistiques de ventes, très importantes pour l'animation d'un site de commerce électronique.
Des équipes spécifiques pour vérifier et compléter les informations
La constitution du catalogue de produits est une étape cruciale, et le maintien de sa qualité fondamental.
' Si la donnée est erronée à la base, cela relève de la responsabilité de la personne chargée de la saisie ', martèle Denis Mennesson. Aussi les entreprises web ont-elles mis en place des équipes spécifiques. Les référentiels qui existent ne répondent pas forcément aux divers niveaux d'exigence et ne correspondent pas forcément aux modèles qu'utilisent leurs catalogues. Et là, point de remèdes tels que la suppression des doublons ou la remise en cohérence des champs de la base de données. Il s'agit le plus souvent d'apporter des informations faisant défaut.
' Pour les produits high-tech, nous utilisons notre référentiel, nous comparons ensuite avec les bases de données de l'éditeur américain Cnet et des constructeurs, développe Denis Mennesson.
Nous avons une équipe de rédacteurs techniques dont le travail consiste à aller chercher l'information manquante. Les fiches produits ainsi créées subissent deux relectures, l'une rédactionnelle et l'autre technique. 'Chez PriceMinister, l'on retrouve le référentiel Cnet.
' Nous utilisons la base de données Décitre pour les livres, CDMail pour les CD. Pour les autres produits, nous créons un référentiel ou enrichissons des bases de données existantes ', détaille Justin Ziegler. Quatre personnes se consacrent à l'importation de fiches produits en provenance des référentiels.
' Nous avons développé une application extrêmement paramétrable qui permet, quel que soit le format des fichier reçus, de créer une nouvelle fiche produit ou de le rattacher à une fiche existante. ' Une équipe de six personnes valide les données saisies par les internautes relatives aux produits mis en vente. Là encore, la qualité des données est un enjeu de taille. PriceMinister compte sur son expérience pour réussir le lancement de son site espagnol.
' Nous gagnerons du temps dans l'atteinte du niveau de qualité de service requis ', espère Justin Ziegler.
Les internautes appelés à la rescousse
Après plusieurs années d'expérience, les sociétés purement internet gèrent toujours leurs référentiels produits de façon empirique. Après avoir développé entièrement leur système d'information ?" les progiciels existant à leurs débuts ne couvrant pas leurs besoins ?" elles doivent aujourd'hui trouver des solutions spécifiques.
' Nous suivons plusieurs pistes, l'une repose sur des contrôles humains, comme c'est déjà le cas. L'autre sur des algorithmes, confie Justin Ziegler.
Mais pour automatiser un processus, il faut pouvoir mettre en place une métrique. Dans le cas présent, arrêter un ensemble de règles, pour décider ?" étant donné un ensemble d'identifiants, concordants ou non ?" de déclarer identiques ou différents deux produits similaires. ' Un autre moyen consiste à solliciter les internautes.
' Nous leur demandons de signaler les fiches de produits en double ', avoue Justin Ziegler. Pour sa part, Denis Mennesson prône l'adaptation.
' Notre structure est récente, le système d'information cohérent. Nous devons faire en sorte qu'il le reste, en dépit des évolutions qui l'affecteront. A nous de développer les outils pour faciliter l'acquisition et l'exploitation des données nécessaires à notre activité. '