L'enjeu des données de recherche
Entretien avec Philippe Mulhem, chercheur en informatique
Au laboratoire Clips-Imag de Grenoble, Philippe Mulhem travaille sur les systèmes de recherche d'information multimédia. L'idée ? Utiliser des algorithmes d'apprentissage pour générer automatiquement des requêtes sur le web. Et
reconfigurer ainsi au fil de l'eau une demande initiale, sans intervention de l'utilisateur. ' Actuellement, on pose une requête et on attend la réponse, dit-il. Cela n'a pas changé depuis quarante
ans. ' Travaillant sur les interfaces homme-machine des systèmes de recherche d'information, l'équipe du Clips-Imag essaie de rendre le processus plus interactif. Les chercheurs ciblent leur approche sur l'utilisateur et son
besoin d'information : ' La difficulté consiste à trouver à quel moment faire du " push ", afin que le système informe l'utilisateur mais ne le noie pas sous un flot d'informations inadaptées à ses
besoins. Il faut pouvoir poser des requêtes sans en avoir l'air. ' L'idéal ? Fournir au système un document en exemple, puis le laisser se débrouiller seul. Or, ce domaine, qui se situe aux frontières de l'apprentissage
en intelligence artificielle et de la recherche d'information, pâtit d'un manque récurrent de données d'expérimentation. Les documents multimédias sont, par définition, de natures multiples. Images, vidéos, pages HTML accessibles en ligne...
aucun fonds commun de recherche scientifique n'en recueille ni n'en définit de corpus. La difficulté est d'autant plus grande en France, que les relations entre les laboratoires académiques et les entreprises n'y sont pas monnaie courante. Philippe
Mulhem apportait toutefois une réponse la semaine dernière à la quatrième conférence en recherche d'information, Coria 2007, organisée par l'Ecole des mines de Saint-Etienne : ' Dans les relations entre laboratoires et
entreprises, les données représentent un point important, soulignait-il à la table ronde réunissant chercheurs et responsables d'entreprises. Les jeux dessais sont donc un bon moyen pour discuter entre
nous. 'a.muller@01informatique.presse.fr