OpenAI peut cloner une voix en seulement 15 secondes

OpenAI peut cloner une voix en seulement 15 secondes

OpenAI vient de lâcher une bombe dans le monde de la tech : la possibilité de cloner n'importe quelle voix avec juste 15 secondes d'enregistrement audio. On parle là d'une extension de leur API de synthèse vocale, mais franchement, ça va bien au-delà.

L'info fraîche, c'est le lancement d'un outil baptisé Voice Engine. Cette technologie, c'est un peu comme si on avait capturé la quintessence vocale de quelqu'un en quinze secondes chrono. OpenAI assure que le résultat, c'est une parole fluide, naturelle, avec une dose d'émotion et de réalisme qui frôle l'incroyable.

C'est pas un coup d'essai pour OpenAI. Ils mijotent ce projet depuis 2022, utilisant une mouture de cet outil pour donner vie aux voix prédéfinies de leur API actuelle et à la fonctionnalité "Lire à haute voix". Si vous passez sur leur blog, il y a des extraits audio à écouter. Et croyez-moi, c'est bluffant. On en vient à se demander jusqu'où ça peut aller, pour le meilleur comme pour le pire.

L'idée, c'est que cette techno pourrait révolutionner pas mal de trucs : donner un coup de main pour lire, traduire des langues à la volée, ou encore aider ceux qui galèrent avec des troubles de la parole, qu'ils soient soudains ou dégénératifs. Il y a même un programme pilote à l'Université Brown qui a permis à une personne avec des difficultés d'élocution de retrouver une voix, grâce à un clone vocal pioché dans un projet scolaire.

Mais voilà, avec les grands pouvoirs viennent les grands risques. Les mauvais coups, genre deepfakes, c'est déjà un casse-tête, et cette techno pourrait en rajouter une couche. Du coup, même si ça promet, OpenAI joue la prudence. Ils admettent qu'il y a des risques, surtout quand on pense aux élections et à tout ce qui peut se jouer sur l'authenticité de l'information.

Ils ne lancent pas tout ça à la légère. OpenAI intègre les retours de partenaires aux États-Unis et à l'international, venant de tous les horizons - gouvernement, médias, éducation, société civile... Et pour les tests, tout le monde doit se plier aux règles du jeu, interdiction de faire passer sa voix clonée pour celle de quelqu'un d'autre sans accord ou droit légal.

Et pour que tout soit clair, ceux qui utiliseront cette techno devront prévenir leur public que la voix vient d'une IA. OpenAI a même pensé à des mesures de sécurité, comme un système de watermark pour tracer l'origine des audios et une surveillance proactive de l'utilisation de leur système. À la sortie officielle, il y aura une liste noire des voix interdites pour éviter les abus.

Quant à la date de sortie et au prix, c'est encore le mystère. Mais si on en croit TechCrunch, OpenAI serait prêt à proposer un tarif défiant toute concurrence. On parle de 15 $ pour un million de caractères, de quoi lire "Shining" de Stephen King. Et pour une version HD, comptez le double. Reste à voir ce que ça donnera.

En tout cas, OpenAI ne chôme pas. Ils viennent d'annoncer un partenariat avec Microsoft pour créer un superordinateur basé sur l'IA, nommé "Stargate", avec un budget de 100 milliards de dollars. Ça promet!

Anthony Rodier
A propos de l'auteur

Anthony Rodier

Que ce soit à travers des critiques objectives, des guides d'achat ou des analyses approfondies, je m'efforce de rendre la technologie accessible à tous, en démystifiant les concepts complexes et en mettant en lumière les aspects pratiques de ces innovations. Mon travail consiste également à partager des réflexions sur l'impact de la technologie sur notre vie quotidienne et à explorer les possibilités fascinantes qu'elle offre pour l'avenir.