Blog

OpenAI est capable de reproduire des voix humaines, mais la technologie ne sera pas rendue publique pour le moment.

OpenAI est capable de reproduire des voix humaines, mais la technologie ne sera pas rendue publique pour le moment.
Written by Yuna

Tl;dr : tout ce qu’il faut savoir sur la nouvelle technologie de synthèse vocale d’OpenAI

  • OpenAI a développé Voice Engine, une IA de synthèse vocale.
  • La technologie n’est pas encore largement disponible en raison de préoccupations éthiques.
  • Elle présente des avantages et des risques significatifs pour la société.
  • Des tests sont effectués avec des partenaires et des règles strictes.
  • OpenAI recommande des mesures pour s’adapter aux risques du clonage vocal.
  • La technologie est utilisée dans ChatGPT et d’autres applications, malgré ses imperfections.

Qu’est-ce que la nouvelle technologie de synthèse vocale d’OpenAI ?

OpenAI a annoncé Voice Engine, un modèle IA de synthèse vocale.

Capable de créer des voix synthétiques réalistes à partir d’un enregistrement audio de seulement 15 secondes.

Les exemples audio sont disponibles sur le site web d’OpenAI.

Pourquoi OpenAI ne diffuse-t-elle pas encore largement cette technologie ?

OpenAI a envisagé un programme pilote pour les développeurs, mais a repensé les implications éthiques.

La société a décidé de ne pas diffuser largement cette technologie pour l’instant.

OpenAI veut souligner le potentiel de Voice Engine tout en renforçant la résilience sociétale face aux modèles génératifs convaincants.

Quels sont les avantages et les risques potentiels de la technologie Voice Engine d’OpenAI ?

Avantages

  • Assistance à la lecture avec des voix naturelles.
  • Portée mondiale pour les créateurs en préservant les accents natifs lors de traductions.
  • Options de parole personnalisées pour les personnes non verbales.
  • Aide aux patients pour récupérer leur voix après des conditions altérant la parole.

Risques

  • Clonage de voix avec seulement 15 secondes d’enregistrement audio.
  • Utilisation abusive potentielle, comme les escroqueries téléphoniques et les appels automatisés de campagne électorale.
  • Risques de sécurité pour les comptes bancaires utilisant l’authentification vocale.

Comment OpenAI teste-t-elle sa technologie Voice Engine ?

OpenAI teste la technologie avec des entreprises partenaires sélectionnées.

HeyGen utilise le modèle pour traduire la voix d’un locuteur dans d’autres langues.

Des règles strictes sont imposées : interdiction d’usurpation d’identité, consentement éclairé et divulgation claire de l’utilisation de l’IA.

Quelles mesures OpenAI recommande-t-elle pour s’adapter à la technologie de clonage vocal ?

Abandon de l’authentification vocale pour les comptes bancaires.

Éducation du public sur la possibilité de contenu trompeur par l’IA.

Développement de techniques pour tracer l’origine du contenu audio.

Comment OpenAI gère-t-elle le développement et le déploiement de sa technologie de synthèse vocale ?

OpenAI a développé Voice Engine fin 2022.

La technologie est déjà utilisée dans le mode conversation parlée de l’application ChatGPT et l’API de synthèse vocale.

Voice Engine est un modèle IA considéré comme « petit », mais les détails de sa taille ne sont pas connus.

La technologie est en concurrence avec d’autres modèles de synthèse vocale et n’est pas parfaite, notamment avec les accents.

About the author

Yuna