Inscrivez-vous gratuitement à la Newsletter BFM Business
Donner du sens à la masse d'informations du web est désormais possible
Avec l'explosion du volume et de l'hétérogénéité des données sur le web, leur exploitation se heurte à deux problèmes. D'une part, les informations accessibles à travers un moteur de recherche tel Google ne représentent que la partie émergée de l'iceberg : une proportion importante reste enfouie, et, de plus, cloisonnée en silos. D'autre part, le rapport signal/bruit diminue et l'effort pour extraire l'information pertinente devient colossal.Les technologies du web sémantique tentent de répondre à ces problématiques, en ajoutant du sens à ces données, en les structurant pour qu'elles soient exploitables par des machines, et en créant des liens entre elles afin de les décloisonner.
Des Français bien positionnés
Le concept a été lancé en 1994 par Tim Berners-Lee, l'inventeur du web. Cette technologie est généralement perçue comme étant encore expérimental. Pourtant, depuis 2004, les standards sont en place, dans lesquels de grands acteurs (IBM, Oracle, Yahoo, Facebook et Google) ont investi. Et depuis 2007, on observe une forte présence industrielle dans ce domaine. Un écosystème d'entreprises innovantes a vu le jour et, pour une fois, la France est bien positionnée, avec des acteurs comme Logilab, Antidot, Semsoft, Datao. C'est dans ce contexte que s'est créé en janvier Semweb. Pro, la première conférence française consacrée au sujet. L'occasion, pour ces acteurs, de montrer leurs premières réalisations, et pour certaines organisations de présenter leurs retours d'expérience.Semsoft, une start up issue d'un essai-mage d'Orange Labs, s'inspire dans sa présentation d'une citation (modifiée) de Charles de Gaulle : “ Des logiciels qui cherchent, on en trouve. Des logiciels qui trouvent, on en cherche… ” Elle propose une solution de fédération de données afin d'enrichir les informations métier. Concrètement, la solution utilise un système de requête sémantique pour interroger différentes sources hétérogènes (Amazon, Flickr, Wikipedia, Youtube…) et intègre les résultats dans le système d'information de l'entreprise (base de données, applications métier…). Les résultats sont alors visualisés dans un environnement 3D généré automatiquement.
Application réussie à la BBC
Parmi les cas d'utilisation présentés, celui de la BBC est emblématique, qui génère ainsi à la volée des portails web thématiques. Un cas exemplaire, dans la mesure où l'institution a mis ses données à la disposition des développeurs. Et, contre toute attente, cette externalisation de l'innovation crée en retour du trafic vers le site de la chaîne britannique. Si les cas clients d'entreprise sont encore rares, la conférence a montré un dynamisme évident dans ce domaine. Le web sémantique est désormais une réalité du terrain et se présente maintenant comme une solution à la gestion de “ l'infobésité ”.
Votre opinion