Systran traduit désormais 130 paires de langue

Passé sous pavillon coréen, le spécialiste de la traduction automatique s'enrichit de nouvelles langues asiatiques. L'éditeur propose aussi des outils d'analyse de texte pour la veille ou la recherche documentaire.
Racheté en avril dernier par le coréen CSLI, Systran part à la conquête du monde. L’éditeur, qui était jusqu’alors surtout présent en Europe et en Amérique du Nord, met le cap sur l’Asie et l’Afrique. Grâce à l’apport de CSLI – rebaptisé Systran International – sa solution de traduction professionnelle Systran Enterprise Server 8 passe de 60 à 130 paires de langues. Elle s’ouvre aux idiomes asiatiques notamment le vietnamien, le thaï, l’indonésien, le malais ou le punjabi mais aussi à certaines langues africaines et moyen-orientales comme le somali et l’hébreux.
La nouvelle version se dote aussi d’un nouveau moteur de traduction hybride associant les atouts les technologies basées sur les règles linguistiques et les traitements statistiques. A la différence de Google et de Microsoft qui s’appuient, eux, sur une approche purement statistique consistant à emmagasiner de nombreux textes traduits et validés par des professionnels puis à définir des probabilités d'occurrence entre les phrases sources et cibles.
Intégrée dans la majorité des navigateurs web mais aussi dans les outils collaboratifs (Lync et Office de Microsoft), la solution peut traduire des sites web ou intranet, des fichiers à la volée ou des conversations chat. Pour affiner les résultats, Systran Enterprise Server 8 fait appel à de nouveaux catalogues de modèles de traduction thématiques. Des corpus couvrant le juridique, les brevets, la santé, la IT ou le tourisme. L’utilisateur peut ainsi personnaliser son profil en fonction de son entreprise ou de son secteur d’activité. Les tarifs de Systran Enterprise Server 8 démarrent à 15 K€ pour l’édition Workgroup (100 utilisateurs) et une paire de langues.
Catégorisation et contraction de texte
Aux côtés de Systran Enterprise Server 8, une autre nouveauté fait son apparition : le Linguistic Development Kit. Distribué aux développeurs et aux partenaires technologiques, ce SDK regroupe un ensemble de sous-composants de la traduction automatique mis au service de l’analyse de contenus multilingues. Des briques qui peuvent être embarquées dans des applications de veille ou de recherche documentaire.
Systran propose ainsi des outils de correction orthographique ou de « simplification » de texte. En éliminant les phrases de liaison ou les qualificatifs surabondants tout en conservant les mots-clés et les noms propres, un texte peut, par exemple, être compressé à 75 %. La fonction de catégorisation va, elle, détecter les noms de personnes ou d’organisations, les indications de lieux et le temps, pour en déduire que ce texte parle essentiellement de politique, de culture ou de cuisine.