----
/
/
Asistentes de IA: el futuro de la conversación natural
Gemini Live

Asistentes de IA: el futuro de la conversación natural

Un futuro tipo “Her”, donde nuestro asistente impulsado por inteligencia artificial puede convertirse en nuestro mejor amigo y más, es una realidad cada vez más plausible.

Todo empezó con la presentación del modo avanzado de voz en chatGPT, una característica que causó cierta controversia meses atrás a propósito de la introducción de GPT-4o.

Curiosamente, la controversia con GPT-4o y el modo avanzado de voz guarda bastante relación con “Her”, pues la voz usada para las demostraciones guarda un tremendo parecido con la de Scarlett Johansson, la actriz que dio la voz a la asistente de inteligencia artificial en esa película.

Para quienes no recuerdan el asunto, hubo especulación respecto a la posibilidad de que OpenAI replicara la voz de Johansson sin su consentimiento. La compañía, por supuesto, negó esto, pero ello no impidió que la actriz amenazara con tomar acción legal.

Siendo el caso que ChatGPT es la herramienta más usada de inteligencia artificial -y, de paso, una de las mejor desarrolladas-, haría sentido pensar que esta es la única opción disponible, pero la realidad es que hay varias opciones en el mercado, y una de esas es Gemini de Google.

Resulta que Google también se ha metido en la onda de asistentes con habilidades avanzadas de conversación fluida y coherente.

En respuesta a la propuesta de OpenAI, Google hizo en esta semana la demostración en vivo de Gemini Live, esencialmente un chatbot impulsado por un motor avanzado de habla que ofrece conversaciones de voz profundas con mayor consistencia, expresividad emocional y realismo que su rival.

Por el momento, Gemini Live ofrece 10 opciones de voces de sonido natural a elegir, siendo una de sus ventajas que el chatbot puede ajustar su ritmo al del usuario.

Asimismo, Gemini Live permite interrupciones mientras habla, tal como ocurre en un diálogo entre dos personas, y también tiene la habilidad de pausar una conversación y retomarla cuando el usuario así lo estime conveniente.

Gemini Live está disponible en el smartphone y puede ser una experiencia de manos libres si así lo desea el usuario. Una ventana de contexto más amplia que el promedio ofrece la posibilidad de un mejor entendimiento y de una mejor memoria por parte del chatbot.

Inicialmente se habló de Gemini Live en  la conferencia de desarrolladores Google I/O 2024. Hasta ahora, para variar, no se han reportado situaciones problemáticas o errores garrafales con la demostración.

Deja una respuesta

AUTORA

ROCIO DIAZ

ARTICULOS RECIENTES

Categorías

instagram