Tras la salida de ChatGPT casi 10 meses atrás, la inteligencia artificial generativa parece estar en todas partes, y pronto eso incluirá a los asistentes de voz tipo Alexa.
A finales de julio, por ejemplo, se supo que Google estaba en esa onda de complementar Google Assistant con inteligencia artificial generativa para así potenciar sus capacidades, impacto y alcance.
Del dicho al hecho hay un camino por recorrer, y, como suele ocurrir con Google, no hay detalles concretos respecto a cuándo estaríamos viendo Google Assistant mejorado e impulsado por inteligecia artificial generativa.
Otro asistente de voz que estará recibiendo el refuerzo de esta tecnología es Siri, según reportes que indican que Apple ya está invirtiendo recursos en ese plan.
Al igual que ocurre con Google, no hay detalles concretos respecto a Apple y Siri, pero es notable que hay reportes conflictivos.
Por un lado, Mark Gurman, de Bloomberg, reportó en julio que se estaba probando a lo interno de la compañía un chat con inteligencia artificial generativo y que este estaría disponible al público en 2024.
En agosto, sin embargo, Ming-Chi Kuo, analista de TF International Securities, indicó que no había indicios de que para 2024 estemos viendo tal ofrecimiento por parte de Apple.
La compañía que sí está clara en la importancia de la inteligencia artificial generativa y la gran oportunidad que encierra a nivel de asistentes de voz en Amazon, según se pudo ver en el evento anual de hardware que tuvo lugar la semana pasada.
Conjuntamente con mejoras en productos como Echo Show y Echo Frames, Amazon introdujo en este evento una modalidad de chat para Alexa, siendo la idea sostener conversaciones de voz normales con el asistente, que ahora comprende contexto, pausas y entonación.
Para lograr esto, Amazon ha desarrollado un modelo de lenguaje amplio (LLM) especialmente adaptado a interacciones de voz, con énfasis en tres áreas clave para los usuarios: obtención de información relevante en tiempo real, control eficiente del hogar y entretenimiento.
Para lograr esa experiencia de conversación fluida y natural, donde entran en juego una serie de claves no verbales que van desde el lenguaje corporal hasta el contacto visual, se han combinado sensores de Echo Show con modelos de inteligencia artificial capaces de procesar y comprender estas claves. Asimismo, se ha reducido la latencia para una experiencia fluida de conversación
Esta combinación de elementos permite a la nueva Alexa procesar información como lo haría un ser humano, lo que a su vez permite programar una serie de tareas complejas enteramente a través de comandos de voz.
Por supuesto, esto de Alexa y su nueva modalidad de conversación es tan solo una mirada preliminar a lo que estaremos viendo y experimentando con el paso del tiempo, pues se trata de una tecnología en constante evolución.
Amazon prevé que Alexa en esta nueva etapa se enriquecerá con cada input particular de sus usuarios, desde preferencias hasta rutinas, para así ofrecer una experiencia de uso más intuitiva y ágil.
Todo esto luce muy interesante, pero ¿qué ocurre si el sistema se hackea o se infiltra? Amazon garantiza seguridad y privacidad, pero todos sabemos que nada es infalible.