Lo que adelantaba Google como una aplicación que conversaba contigo para analizar lo que veía del escenario del Google I/O 2024, terminó conociéndose —hoy— como el «Proyecto Astra». Este es un concepto que transforma el uso de la inteligencia artificial (IA) para interactuar con el entorno a través de dispositivos móviles y vestibles, aprovechando la cámara y las capacidades de voz.
EL proyecto multifacético permite a los dispositivos responder a preguntas y realizar tareas en tiempo real, facilitando la identificación de objetos y la recuperación de elementos perdidos, gracias a que tiene memoria, entre otras funciones.
Las claves de Proyecto Astra
El Proyecto Astra incluye una aplicación que utiliza una interfaz de visor, permitiendo a los usuarios apuntar la cámara de su dispositivo a diversos objetos y preguntar sobre sus características y funciones. Por ejemplo, al enfocar un parlante, el dispositivo puede identificarlo y describir partes específicas como el tweeter, que produce sonidos de alta frecuencia.
Además, tiene la capacidad de recordar objetos fuera de cuadro y localizar elementos perdidos, demostrando un importante (e interesante) avance en la visión por computadora, memoria y la interacción contextual basada en inteligencia a tiempo real.
Según explicó Demis Hassabis, CEO de Google DeepMind, el desarrollo de agentes universales de IA que sean útiles en la vida diaria ha sido un objetivo clave del equipo. Proyecto Astra logra este objetivo al procesar información visual y auditiva de manera continua, integrando estos datos en una línea de tiempo de eventos que permite un recuerdo eficiente y una respuesta rápida. Este nivel de procesamiento multimodal y memoria a corto plazo permite interacciones que se acercan a una conversación natural, un desafío considerable en la ingeniería de la IA.
Estas capacidades están programadas para integrarse —eventualmente en el futuro— en productos de la compañía como la App de Gemini, aunque el enfoque presentado también demuestra la posibilidad de aplicarlo en otro tipo de dispositivos. En la demo se mostró el uso de Astra a través de unas gafas inteligentes que representó una continua interacción entre lo que haces con el teléfono y con las manos libres al usar unos anteojos con cámara.