Récupérer les index métier, un enjeu de taille

Les processus de création ou d'extraction des métadonnées sont relativement simples. La difficulté réside néanmoins dans la sélection de ces dernières et dans la définition de leur périmètre.
- Gestion des flux de documents et interaction avec le système d'information
- Former un couple légitime avec les applications métier
- Bien définir en amont les types de flux
- Choisir la plate-forme prenant en charge les flux documentaires
- Récupérer les index métier, un enjeu de taille
Le rapprochement des données structurées, issues des applications, et des documents, stockés dans la gestion de contenu, fait émerger un nouveau besoin : l’enrichissement de ces mêmes documents en métadonnées. L’enjeu, ici, n’est pas de leur associer des index techniques, simples à obtenir, tels qu’une date de création ou un auteur. Mais, beaucoup plus complexe, de leur adjoindre des attributs métier : un nom de dossier, un type d’affaires, la nature d’un litige, une mention liée à la fiabilité d’un client…
Malgré ces difficultés, ces index fonctionnels sont parfois indispensables. «Un simple identifiant permet de rapprocher les courriers d’un client de ses données, stockées dans une application de GRC, indique Armando Benzaquen d’Inge-Com. Mais seuls des métadonnées supplémentaires ajoutées aux documents aideront à sélectionner, entre autres, tous les contrats liés à ce client ou à visualiser tous ceux qui sont en attente ». A noter que ces métadonnées ne concernent pas seulement les lettres numérisées, mais également les fichiers multimédias.

Comment créer ces index métiers ?
Une partie peut être extraite des données des PGI et donc versée sous la forme de métadonnées dans la plate-forme de gestion de contenu. Ces extractions s’opèrent soit par le biais de services web, soit d’appels aux API soit encore de simples scripts Java. Une autre partie émane potentiellement de flux entrants papier. Les métadonnées sont alors directement récupérées des courriers et des fax via des opérations humaines de vidéo-codage. Dernier cas de figure : les flux « cold », flux d’impression générés par les PGI. «Nous avons mené un autre projet qui nécessitait de récupérer des volumes importants d’informations issues d’une application de paye. Plutôt que de passer par des web services, nous avons interfacé l’application avec la brique Cold, de Documentum, afin de récupérer ces données depuis les flux», décrit Franck-Yves Berenguer d’Euriware. Lors de ces opérations d’importation-exportation, les métadonnées sont stockées dans des fichiers XML associés aux documents.
Une méthode d'indexation à formaliser
Dans la plupart des cas, les coûts de développement liés à ces extractions sont relativement limités. En fait le véritable problème de ces index fonctionnels, relève de leur sélection. «Dans un département de R&D, le nombre de ces index peut monter jusqu’à trente par document technique, schémas ou photos » ajoute Laurent Le Calvé, consultant chez Steria. Autre écueil possible, si les technologies donnent facilement la possibilité de générer les métadonnées nécessaires, le risque existe de dupliquer dans la plate-forme de gestion de contenu celles déjà présentes dans le PGI ou dans les applications métiers. Avec comme effet secondaire de devoir assurer la mise à jour des index fonctionnels entre les différentes applications.
Votre opinion