Un selecto grupo de usuarios de ChatGPT Plus ya tiene acceso a la versión alfa del nuevo modelo de voz para inteligencia artificial de OpenAI. Esta innovación, que se está desplegando a través de la red social de X y LinkedIn, tiene como objetivo mejorar la comunicación en tiempo real en lenguaje natural. Una de sus características destacadas es la capacidad para detectar y responder a las emociones del interlocutor, permitiendo interrupciones en los discursos en cualquier momento.
OpenAI tiene previsto ampliar gradualmente el acceso a esta función en las próximas semanas, con la meta de que todos los usuarios de ChatGPT Plus puedan disfrutar de ella para el otoño. Los participantes en esta fase alfa recibirán notificaciones a través de la aplicación y por correo electrónico, aunque la funcionalidad de video y uso compartido de pantalla estará disponible en un lanzamiento posterior.
En cuanto a las prioridades estratégicas de OpenAI, la calidad y la seguridad de las conversaciones se establecen como puntos clave. El objetivo es garantizar una experiencia óptima, con capacidades mejoradas para soportar millones de conversaciones de voz simultáneas en tiempo real, manteniendo bajos niveles de latencia y alta calidad. Además, se ha trabajado en mejorar la capacidad del modelo para detectar y rechazar contenido inapropiado, con pruebas realizadas con miembros externos que hablan diferentes idiomas y representan diversas regiones geográficas.

Para proteger la privacidad de las personas, el modo de voz avanzado utiliza cuatro voces preestablecidas desarrolladas en colaboración con actores de voz, lo que evita la imitación de voces de figuras públicas o cualquier otro tipo de contenido no autorizado. Asimismo, se han implementado filtros para bloquear la generación de música u otro audio protegido por derechos de autor.
En un esfuerzo por garantizar que ChatGPT sea seguro y beneficioso, se han aplicado medidas de seguridad a todos los formatos, incluyendo texto y voz. Durante agosto, la compañía tiene previsto publicar un informe detallado sobre sus esfuerzos para optimizar la seguridad y mejorar la experiencia del nuevo modo de voz avanzado.
La fase alfa de este proyecto ha sido diseñada para probar, aprender y perfeccionar el sistema, con el fin de ofrecer la mejor experiencia posible. La implementación por fases permite un seguimiento detallado del uso de la herramienta, lo que facilita realizar ajustes y mejoras en función de la retroalimentación del público.

GIPHY App Key not set. Please check settings