Inscrivez-vous gratuitement à la Newsletter BFM Business
Le logiciel libre Talend Open Studio 2.0 comprend des connecteurs Perl et Java et accepte deux modes de transformation de données.
ETL libre, Talend Open Studio (TOS) est le fruit de trois ans de développement : ' Nous avons plusieurs dizaines de clients grands comptes et PME qui ont souscrit à notre offre d'assistance et espérons atteindre la centaine d'ici à la fin de l'année. TOS a été développé car les ETL propriétaires étaient lourds, peu " scalables " et chers ', résume Bertrand Diard, cofondateur de Talend. À la manière de MS Visio, le module Business Modeler permet aux non-spécialistes de représenter le flux des traitements à opérer. La création des processus d'exécution passe par une interface graphique s'appuyant sur Java Eclipse RCP.
Davantage de connecteurs
Un module de débogage sert à vérifier le traitement appliqué et indique, par exemple, les données rejetées. Le traitement des données était réalisé jusqu'à cette version 2.0 uniquement en langage Perl, ' choisi pour ses performances et l'abondance de scripts développés dans ce langage ', indique Yves de Montcheuil, directeur marketing de Talend. TOS 2.0 propose de générer du code Java : tous les connecteurs Perl ont donc leur équivalent Java. D'une quarantaine, leur nombre est passé à une centaine avec cette version, pour les SGBD mais aussi les annuaires LDAP, les serveurs de messagerie, FTP, etc. ' TOS vise le marché de l'intégration de données opérationnelles, et pas seulement celui de la Business Intelligence ', rappelle Bertrand Diard. TOS possède un module dédié à la qualité des données avec fonction de dédoublonnage et mise en correspondance par logique floue (Mc Donald pour Mac Donald, par exemple). TOS 2.0 peut fonctionner en mode ETL, mais aussi ELT, lors duquel les transformations sont réalisées sur le SGBD cible à l'aide de requêtes SQL : ' Le mode ELT exploite la puissance de la machine cible et est plus efficace dans un contexte homogène, par exemple pour une mise à jour massive dans un même SGBD. Le mode ETL reste plus efficace, par exemple, pour extraire les données d'un logiciel de GRC vers un fichier plat ', explique Yves de Montcheuil.
Votre opinion