Inscrivez-vous gratuitement à la Newsletter BFM Business
En témoignent les récents rachats d'Inxight et de ClearForest, les technologies d'analyse textuelle attisent les convoitises, certains estimant que le contenu des champs des bases de données n'est pas seul porteur de sens.
ClearForest, racheté fin avril par Reuters, Inxight à la mi-mai par Business Objects : ces deux acquisitions printanières d'éditeurs de logiciels d'analyse textuelle, ou ' text mining ', attestent de l'intérêt porté au contenu non structuré. Sous cette appellation, on retrouve toutes les informations textuelles stockées dans les fichiers bureautiques, la messagerie ou encore sur les intranets. Concurrent de Business Objects, Cognos regarde ces techniques de près et a déjà signé des partenariats. Raison de cet engouement : ' Le capital connaissance d'une entreprise se situe plus dans les différents documents textuels que dans les champs d'une base de données ', analyse Nicolas Macquaire, président de la société Entropy-Soft, qui vient de lancer un outil de migration pour contenu non structuré (lire p. 16). ' Le chiffre de 80 % de données non structurées dans l'entreprise est souvent annoncé. Nous avons mesuré 60 % lors d'une récente étude ', détaille l'analyste Fern Halper, du cabinet Hurwitz & Associates. Ce qui est sûr, c'est que ' ces rachats prouvent que le text mining est devenu un vrai sujet ', se réjouit Bernard Normier, PDG de Lingway.
Déclinaisons spécialisées
Cet enthousiasme tout neuf des éditeurs de business intelligence masque une tendance de fond. Surtout implanté aux États-Unis, Inxight fournit depuis longtemps son logiciel ' à de nombreuses agences gouvernementales de renseignements ou à des services de l'armée pour faire de la veille et traquer leurs cibles en analysant les contenus textuels publiés sur le réseau, à partir de mots-clés ', certifie son fondateur, Ian Hersey. Europol s'est équipée fin 2006 d'une application développée conjointement par Temis et IBM pour traquer le crime organisé. ' Cette application identifie des similitudes entre des crimes et délits survenant dans différents lieux et pays ', explique Éric Brégand, PDG de Temis. Autre secteur équipé depuis des années, l'industrie pharmaceutique, dont les services de recherche et de développement utilisent le text mining pour faire de la veille scientifique. Mais les laboratoires utilisent également ces technologies à des fins de marketing. Lors du lancement d'une nouvelle molécule, il peut être intéressant d'étudier les réactions des clients à travers l'étude de blogs. Le laboratoire Pfizer a, par exemple, investi dans une solution de veille de Temis, ' chargée de surveiller les blogs de patients. Si un blogueur évoque des effets secondaires inédits suite à la prise d'une nouvelle molécule, l'application envoie une alerte ', décrit Éric Brégand. Autres habitués du text mining, les fournisseurs d'informations payantes, Factiva, LexisNexis ou Thomson, qui intègrent peu ou prou ces technologies dans leurs offres. Le rachat de ClearForest par Reuters s'inscrit dans cette tendance, tout comme celui, fin 2006, de Datops par LexisNexis. Les sociétés spécialisées dans la recherche de brevets et marques se servent du text mining pour faire de la veille. Ainsi, Questel Orbit dispose d'une palette de logiciels faisant appel à toutes les technologies d'analyse linguistique. Des généralisations à d'autres domaines émergent ici et là. ' Nous avons déjà plus de cinquante clients en France faisant appel à nos services pour analyser des annonces d'emploi, des descriptions de postes, des CV, et tous les documents RH de ce type ', annonce Bernard Normier, de Lingway. Pour Renaud Finaz, responsable marketing de l'intégrateur en business intelligence, Micropole Univers, ' la GRC peut aussi tirer parti de l'analyse sémantique. Un centre d'appels pourrait étudier le contenu sémantique des commentaires des interlocuteurs, pour automatiser l'étude des impressions de ses clients '. De même, les médecins d'un hôpital pourraient enrichir la connaissance qu'ils ont de leurs patients en faisant des statistiques à partir des annotations portées sur chaque dossier patient.
Une intégration complexe
Si les perspectives marché sont optimistes, les dés ne sont pas encore jetés. Pour les éditeurs d'abord. Comme les récentes acquisitions l'ont montré, les spécialistes du secteur sont des cibles tentantes. Numéro un mondial des éditeurs indépendants depuis quelques semaines, le français Temis connaît une croissance impressionnante. 60 % entre 2005 et 2006 avec un chiffre d'affaires de 4 millions d'euros. ' Les 6 millions d'euros devraient être atteints cette année ', prévoit Éric Brégand. Même tendance pour Lingway, qui a doublé son chiffre d'affaires entre 2005 et 2006. Pour s'affirmer, ces éditeurs ont adopté une démarche verticale, ce qui leur permet de proposer des progiciels métier en lieu et place de briques technologiques intégrées dans des applications plus larges. Cette croissance ne met pas ces éditeurs à l'abri d'un rachat, peut-être par un acteur de la BI. Du côté des éditeurs de business intelligence, le responsable de la recherche et développement de Business Objects, Hervé Couturier, estime que ' l'intégration technique d'Inxight devrait se faire aisément à la plate-forme BO grâce à une architecture basée sur les services web '. Cependant, l'intégration ne doit pas être que technique, mais aussi culturelle. ' L'utilisation combinée de la BI et du text mining représentera un défi culturel pour l'utilisateur, juge Renaud Finaz. Mais aussi pour les éditeurs. BO a acquis une pépite, mais il lui faudra bien comprendre l'intérêt de cette technologie sous peine de voir Inxight se dissoudre. ' Même constat pour Éric Brégand de Temis : ' Si l'intégration du produit d'Inxight se limite à automatiser l'ajout d'indicateurs numériques correspondant, par exemple, à la satisfaction client, la technologie sera sous-utilisée. '
Votre opinion