BFM Business
Services

Cette intelligence artificielle chinoise peut cloner votre voix

La technologie de Baidu a trompé un système de reconnaissance vocal

La technologie de Baidu a trompé un système de reconnaissance vocal - MANJUNATH KIRAN / AFP

Des chercheurs ont élaboré une technologie qui peut imiter une voix, à partir d'un enregistrement sonore de moins d'une minute. Un outil qui pourrait faire des ravages s'il tombait entre de mauvaises mains.

Et si quelqu’un pouvait usurper votre voix? Il pourrait prendre le contrôle de votre enceinte connectée par exemple. Des chercheurs de l’entreprise chinoise internet Baidu affirment avoir développé un outil basé sur l’intelligence artificielle, capable d’imiter une voix. Le tout, à partir d’un échantillon sonore de moins d’une minute, rapporte le site américain Digital Trends.

“D’un point de vue technique, c’est une percée importante”, a confié à Digital Trends, Leo Zou, un membre de la communication de Baidu. Car auparavant, il fallait de très nombreux échantillons pour réussir à reproduire une voix. Baidu n’est pas la première entreprise à s’atteler au clonage de voix grâce à l’intelligence artificielle. Lyrebird, un projet lancé par une start-up montréalaise, avait réussi à imiter la voix du président Donald Trump et celle de son prédécesseur, Barack Obama.

Capable de tromper un système de reconnaissance vocale 

La synthèse d’échantillons de voix élaborée par Baidu n’est certes pas parfaite mais elle est suffisante pour tromper un système de reconnaissance vocale. La technologie a été élaborée à partir de 800 heures d’enregistrement de 2400 voix différentes. Pour que la synthèse de voix soit très satisfaisante, il faut cent extraits de cinq secondes. Mais avec seulement cinq, Baidu a réussi à tromper plus de 9 fois sur 10 un système de reconnaissance vocale. Des expérimentations de clonage sont à écouter sur ce site.

“Nous voyons de nombreuses utilisations possibles pour cette technologie. Par exemple, le clonage pourrait aider les patients qui ont perdu leur voix”, affirme Leo Zou. “Une mère pourrait aussi configurer un lecteur de livre audio avec sa propre voix”, continue-t-il. ou servir à créer des assistants numériques personnalisés et des services de traduction vocale plus naturels.

Couplé au dispositif qui permet de superposer un visage sur le corps d’une autre personne, comme l’application FakeApp, l’outil chinois serait susceptible de faire des ravages. Certaines personnes mal intentionnées pourraient s'en servir pour élaborer des fake news. Des chercheurs de l'université de Washington avait réussi à créer un faux discours du président Barack Obama.

Pauline Dumonteil