Google ha dado un paso adelante en la competencia de inteligencia artificial generativa al anunciar Gemini Live, un nuevo modo de voz para su modelo de IA Gemini a través de la aplicación móvil Gemini. Con esta función, los usuarios pueden mantener conversaciones fluidas con el modelo en lenguaje conversacional y hasta interrumpirlo para que responda con una voz y cadencia similar a la humana.
A pesar de que OpenAI presentó su «Modo de Voz Avanzado» para ChatGPT hace algunos meses, Google ha logrado implementar Gemini Live de manera más extensa y disponible para una audiencia potencial mucho más amplia. Esta función, disponible en inglés en la aplicación Gemini para dispositivos Android a través de una suscripción avanzada a Gemini ($19.99 USD al mes), pronto estará también en iOS y en más idiomas.
Sin embargo, OpenAI podría haber retrasado su Modo de Voz Avanzado para ChatGPT debido a pruebas de seguridad adversaria que demostraron ciertos comportamientos inquietantes, como la reproducción de la voz del usuario sin consentimiento. Este tipo de comportamiento podría tener consecuencias potencialmente peligrosas, como el fraude o el uso malintencionado de la tecnología.
Aún se desconoce cómo Google abordará las posibles consecuencias negativas de esta tecnología, a pesar de que VentureBeat se ha puesto en contacto con la compañía para obtener más información al respecto.
Gemini Live se presenta como una herramienta útil para la generación de ideas, la preparación de conversaciones importantes o simplemente para mantener charlas informales sobre diversos temas. Esta función permite interacciones sin necesidad de usar las manos, lo que facilita su uso incluso cuando el dispositivo está bloqueado o se ejecutan otras aplicaciones en segundo plano.
Por otro lado, Google anunció que el modelo de IA Gemini está completamente integrado en la experiencia del usuario de Android, proporcionando asistencia contextualizada adaptada al dispositivo. Los usuarios pueden acceder a Gemini manteniendo pulsado el botón de encendido o usando el comando «Hey Google».
En resumen, Google ha dado un paso significativo con Gemini Live, ofreciendo una experiencia de conversación natural y adaptativa que promete ser útil para una variedad de situaciones. A medida que la inteligencia artificial evoluciona, Gemini se posiciona como un asistente personal más intuitivo y conversacional, listo para ayudar en tareas complejas.
GIPHY App Key not set. Please check settings