Google ha adelantado un nuevo desarrollo en inteligencia artificial, específicamente una funcionalidad de cámara y Gemini, que será presentada en detalle en su próxima conferencia anual Google I/O. La empresa publicó un video en X mostrando un servicio que permite a la cámara de un dispositivo móvil identificar en tiempo real lo que está sucediendo en su entorno.
En el video, al apuntar la cámara hacia el escenario del evento, Gemini responde a la pregunta del usuario sobre lo que ocurre, describiendo los preparativos de un gran evento y reconociendo las letras «IO» como parte de la conferencia de desarrolladores de la compañía.
La IA de Gemini identifica elementos visuales y también genera preguntas para obtener más contexto y ofrecer respuestas más precisas. Este enfoque conversacional es similar al de otras tecnologías, como las gafas inteligentes de Meta con capacidades multimodales de IA, pero Gemini parece destacarse por la naturalidad de su interacción y la relevancia de sus respuestas.
Mira el video publicado a continuación:
El anuncio resalta la competencia que existe con tecnologías similares de empresas como OpenAI, quien precisamente hoy presentó a GPT-4o (Omni) con capacidades similares a través de su App para celulares. Además, Google destaca el potencial para integrar sus nuevas herramientas IA en dispositivos móviles y hace un ojo a las dudas que generan dispositivos externos de inteligencia artificial como los de Rabbit y Humane.
Por lo pronto, esto fue una ‘probadita’ a lo que veremos mañana en la presentación principal de la compañía desde el escenario del I/O en Mountain View, Estados Unidos. Y prepárense porque la estaremos transmitiendo aquí en la Web de OhMyGeek! desde las 13:00 h. Chile.