El modelo, llamado Voice Generation, ha estado en desarrollo desde finales de 2022 e impulsa la función Leer en voz alta en ChatGPT
.1. Introducción a Voice Engine de OpenAI
OpenAI ha lanzado una plataforma de generación de texto a voz llamada Voice Engine, que ofrece acceso limitado a empresas seleccionadas. Esta tecnología puede crear voces sintéticas basadas en grabaciones de voz de 15 segundos, permitiendo la lectura de texto en varios idiomas y para diversos propósitos.
Puede leer también | ChatGPT musical en Suno, startup innovadora
2. Empresas que tienen acceso
Empresas como Age of Learning, HeyGen, Dimagi, Livox y Lifespan tienen acceso a esta plataforma. Cada una de estas empresas utiliza la tecnología de Voice Engine de diferentes maneras, desde educación hasta aplicaciones de salud y comunicación.
Puede leer también | ChatGPT vs Copilot: Aplicaciones prácticas para el entorno laboral
3. Ejemplos de uso
Age of Learning ha estado utilizando la tecnología para generar contenido de voz en off preescrito, mientras que también se pueden generar "respuestas personalizadas en tiempo real" a los estudiantes, escritas por GPT-4.
Puede leer también | Cómo Utilizar ChatGPT para que tengas ventas exitosas
4. Desarrollo y entrenamiento del modelo
OpenAI comenzó a desarrollar Voice Engine en 2022, y el modelo ha sido entrenado con una combinación de datos licenciados y disponibles públicamente. La tecnología ya ha sido implementada en la API de conversión de texto a voz y la función de lectura en voz alta de ChatGPT.
Puede leer también | Gemini, el competidor de Google en ChatGPT, podría presentarse en enero 2024
5. La evolución de la generación de voz con IA
La generación de texto a audio con IA es un campo en constante evolución. Aunque la mayoría de las aplicaciones se centran en sonidos instrumentales o naturales, menos se han enfocado en la generación de voz. Algunas compañías en este espacio incluyen Podcastle y ElevenLabs.
Puede leer también | Cosas que puedes hacer ahora con chat GPT-4
6. Regulaciones y ética
El gobierno de EE. UU. está interviniendo para regular el uso ético de la tecnología de voz IA, especialmente después de incidentes donde se utilizaron voces de IA en llamadas automáticas no deseadas. OpenAI y sus socios se comprometen a seguir políticas éticas, obteniendo consentimiento para usar las voces originales, evitando la suplantación de identidad y agregando marcas de agua para rastrear el origen de los clips de audio.
Puede leer también | ChatGPT ya es compatible con Dall-E 3
7. Medidas sugeridas por OpenAI
OpenAI sugiere varias medidas para mitigar los riesgos asociados con el uso de tecnologías como Voice Engine, que incluyen políticas de protección de la identidad, educación sobre deepfakes de IA y el desarrollo de sistemas de seguimiento de contenido de IA.
Puede leer también | Claude 2 el rival de ChatGPT lanza un chatbot capaz de resumir una novela
8. Impacto y futuro
El desarrollo de tecnologías de generación de voz con IA tiene un gran impacto en diversas industrias, desde la educación hasta la salud y la comunicación. Se espera que estas tecnologías continúen evolucionando y desempeñando un papel importante en el futuro de la interacción humano-computadora y la creación de contenido multimedia.
Puede leer también | Del test de Turing al ChatGPT: breve historia de la IA