En mayo de este año, OpenAI sorprendió a todos al anunciar el lanzamiento del tan esperado «Modo de voz» para ChatGPT, siguiendo los pasos de la película «Her». Sam Altman, una mente empresarial clave en OpenAI, había prometido novedades en las próximas semanas, pero posteriormente se vio que se requería más tiempo para abordar ciertos desafíos de seguridad.
Recientemente, la versión final del «Modo de voz» de ChatGPT, denominada ChatGPT Plus, ha sido lanzada en una implementación alfa cerrada para usuarios seleccionados. Este período de prueba se extenderá hasta agosto, momento en el cual estará disponible para todos los usuarios de los planes de pago correspondientes.
Una de las características más esperadas es la posibilidad de mantener conversaciones con ChatGPT de forma mucho más natural, ya que ahora es capaz de manejar interrupciones y expresiones emocionales. Esta mejora se debe al nuevo modelo multimodal GPT-4o, el cual procesa la voz de manera más eficiente y con una latencia extremadamente baja.

Una de las noticias destacadas es la capacidad de ChatGPT para funcionar en más de 45 idiomas, aunque actualmente solo ofrece cuatro opciones de sonidos distintos. Lamentablemente, la opción de tener la voz de «Sky», que se asemejaba a Scarlett Johansson en la película «Her», no estará disponible tras la reacción negativa de la actriz ante la similitud.
En cuanto a las capacidades visuales de ChatGPT, se espera que en el futuro pueda asistir en tareas como ayudar a niños con sus deberes o describir entornos, pero estas funciones se encuentran en desarrollo y llegarán más adelante según declaraciones de la empresa.
El lanzamiento del «Modo de voz» de ChatGPT es un paso significativo en la evolución de la inteligencia artificial y promete cambiar la forma en que interactuamos con las máquinas. A medida que la tecnología avanza, es emocionante presenciar cómo estas innovaciones transforman nuestra manera de comunicarnos y realizar tareas cotidianas.

GIPHY App Key not set. Please check settings