VASA-1, l'IA de Microsoft qui crée un deepfake avec une photo et un enregistrement audio

VASA-1 est un projet novateur de Microsoft qui suscite l'intérêt et l'inquiétude. Cette Intelligence Artificielle a la capacité de créer des deepfakes en utilisant uniquement une photo et un enregistrement audio. Cette avancée technologique soulève des questions éthiques et de sécurité, car elle pourrait être utilisée de manière malveillante pour manipuler des images et des discours. Les implications de cette technologie sont vastes, et il est essentiel de comprendre les risques potentiels qu'elle comporte. L'émergence de VASA-1 soulève des débats sur la réglementation de l'IA et met en lumière les défis éthiques liés à son utilisation dans la société moderne.

Index

VASA, l'IA de Microsoft révolutionne la création de deepfakes en temps réel
Le réalisme saisissant de VASA: une simple photo et un enregistrement audio suffisent
VASA-1, une IA trop dangereuse pour être libérée
Meta présente sa nouvelle IA générative Llama 3, affirmant qu'elle est supérieure à Gemini

VASA, l'IA de Microsoft révolutionne la création de deepfakes en temps réel

Une simple photo et une enregistrement audio est tout ce qu'il faut pour que VASA-1, la nouvelle Intelligence Artificielle générative de Microsoft, crée un deepfake en quelques secondes. Ce phénomène n'est pas nouveau, mais jamais il n'a été aussi réaliste et en temps réel. VASA-1 est une IA générative qui a seulement besoin d'une photo d'identité, d'une phrase audio pour engendrer instantanément un deepfake d'une qualité extrêmement réaliste, avec synchronisation labiale, gestes naturels et mouvements de tête. Vous pouvez visualiser cela dans cette vidéo :

Il est facile de remarquer que la vidéo a été créée par une IA, mais il est impressionnant de constater un tel réalisme à partir d'une simple photo statique. Il est important de souligner que toutes les personnes apparaissant dans les images de cette nouvelle n'existent pas non plus, elles ont également été créées par une IA, plus précisément StyleGAN2 et DALL·E 3. Ainsi, rien de ce que vous voyez ici n'est réel.

Le réalisme saisissant de VASA: une simple photo et un enregistrement audio suffisent

Les principales innovations incluent un modèle holistique de dynamique faciale et de génération de mouvements de tête fonctionnant dans un espace latent facial, comme l'explique le communiqué de Microsoft. Derrière VASA-1 se trouve Microsoft Asia, une équipe composée d'experts en IA tels que Sicheng Xu, Guojun Chen, Yu-Xiao Guo, Jiaolong Yang, Chong Li, Zhenyu Zang, Yizhong Zhang, Xin Tong et Baining Guo.

Les créateurs de VASA-1 affirment que cette IA surpasse toutes les autres spécialisées dans la création d'avatars virtuels. VASA-1 se distingue par sa capacité à générer des vidéos de haute qualité en temps réel avec une dynamique faciale et une tête réalistes, avec une résolution allant jusqu'à 512 x 512 pixels et 40 images par seconde, et une latence de moins de 170 ms, en utilisant une carte graphique RTX 4090.

VASA-1, une IA trop dangereuse pour être libérée

Il est à noter que VASA-1 n'émule pas la voix, c'est-à-dire qu'elle n'est pas capable de générer de nouveaux enregistrements audio. Elle utilise l'enregistrement fourni. Cependant, la synchronisation labiale est réellement spectaculaire.

Bien sûr, Microsoft n'a pas développé cette intelligence artificielle générative dans le but de créer des deepfakes, mais plutôt pour concevoir des avatars réalistes qui imitent les comportements conversationnels humains. L'idée étant d'utiliser ces avatars dans des services d'assistance clientèle, des jeux vidéo, des applications, etc.

Meta présente sa nouvelle IA générative Llama 3, affirmant qu'elle est supérieure à Gemini

Alors que les avatars peuvent être générés automatiquement, VASA-1 dispose d'une série de paramètres de personnalisation pour rendre le personnage virtuel plus joyeux, plus sérieux, plus ou moins expressif, etc. Avec VASA-1, Microsoft ne cherche pas à créer des deepfakes, mais est conscient que c'est ce que les gens feront en premier lieu. C'est pourquoi, pour l'instant, aucune démonstration, API ou version commerciale ne sera lancée, tant que nous ne sommes pas sûrs que la technologie soit utilisée de manière responsable. Et cela ne se produira jamais.

Brigitte Chevalier

Je m'appelle Brigitte et je suis rédactrice pour la page web Info General, un journal généraliste spécialisé dans l'actualité technologique. Je m'efforce de traiter l'actualité avec rigueur et objectivité, en fournissant à nos lecteurs des informations précises et pertinentes. Mon objectif est d'informer de manière claire et impartiale sur les dernières avancées technologiques, en mettant en lumière les enjeux et les implications de ces évolutions pour notre société. Je suis passionnée par mon travail et je m'engage à offrir à nos lecteurs une information de qualité.

Hisense dévoile ses nouvelles télévisions avec le Mini-LED en vedette et des options pour tous.

Guerre des prix avec le MacBook Air M2 : MediaMarkt et Amazon le réduisent à moins de 1 000 euros

Roborock lance en Espagne le premier aspirateur du monde avec Matter : voici le S8 MaxV Ultra

Google Podcasts a migré son contenu vers YouTube Music, mais ne convainc personne.

Les 10 smartphones du marché qui émettent le plus de rayonnement, mais vous ne devriez pas vous inquiéter trop.

Même si cela peut sembler incroyable, l'IA n'a toujours pas surpassé l'être humain en mathématiques compétitives.

Ce Mini PC avec Intel N100 est plus puissant que les Raspberry Pi mais tout aussi bon marché

Le numéro 667 de Computer Hoy est maintenant disponible dans votre kiosque!

Ils ont un son spatial 3D et une annulation de bruit, mais leur prix est ridicule et ils rivalisent avec les AirPods Max.

6 ans de bonheur avec mon NAS : voici les utilisations que j'en fais tous les jours

VPN pour toute votre famille et à 82% de réduction : Surfshark baisse le prix de son abonnement le moins cher

Google intègre Gemini dans Chrome et vous obtiendrez une IA gratuite dans la barre d'adresse du navigateur

Laisser un commentaire Annuler la réponse