BFM Business
Services

Cette intelligence artificielle peut faire dire n'importe quoi à n'importe qui

L'université Paul Allen de Washington a testé sa technologie sur des vidéos officielles de Barack Obama. Elle sera dévoilée au public cet été à Los Angeles.

L'université Paul Allen de Washington a testé sa technologie sur des vidéos officielles de Barack Obama. Elle sera dévoilée au public cet été à Los Angeles. - Tobias Schwartz - AFP

Des chercheurs américains ont créé une technologie idéale pour créer des fake news. Elle permet de convertir des fichiers audio en mouvement de bouche sur une vidéo. Les tests réalisés sur des vidéos de Barack Obama sont bluffants de réalisme.

Si cet outil tombe un jour entre leurs mains, les champions des "fake news" (fausses nouvelles) pourraient détenir une arme bien plus redoutable que Photoshop. Il s’agit d’une application basée sur une intelligence artificielle qui permet sur une vidéo de faire dire ce que l’on veut à n'importe qui. Pas en réalisant un grossier doublage, mais en convertissant chaque parole prononcée en mouvement de la bouche. 

Cette technologie dévoilée par The Verge à été mise au point par des chercheurs de l'université Paul W. Allen de Washington. Et pour montrer son potentiel, ils ont réalisé des tests avec des vidéos de Barack Obama. Sur deux images, on voit l’ancien président américain prononcer le même discours à l’intonation près. À gauche l’original, à droite la vidéo trafiquée. Bluffant !

Dix-sept heures ont été nécessaires pour réaliser 20 secondes de vidéos truquées, mais Ira Kemelmacher-Shlizerman, universitaire qui pilote cette unité de recherche, a indiqué à The Verge que d’ici peu, une heure suffira pour parvenir au même résultat.

Pour l’équipe de chercheurs, il ne s’agit évidemment pas de faciliter la création de fake news. Ce système, qui sera dévoilé au public au Siggraph, un salon technologique qui se tiendra début août à Los Angeles, a été créé pour améliorer les outils de discussion en VOIP en créant des conversations vidéo à partir de texte saisi.

"Lorsque vous regardez Skype ou Google Hangouts, l’image n’est jamais très bonne à cause du réseau alors que l'audio est de bonne qualité", relève ainsi Steve Seiz, co-auteur et professeur d'Allen School, dans un communiqué. "L'audio permettrait ainsi de produire des vidéos de haute qualité". Mais pas seulement. "On pourrait aussi tenir des conversations virtuelles avec des personnages historiques", ajoute Ira Kemelmacher-Shlizerman. Mais on peut imaginer les conséquences si on fait dire n’importe quoi à un dirigeant ou au patron d’une grande entreprise. 

Pascal Samama
https://twitter.com/PascalSamama Pascal Samama Journaliste BFM Éco