El asistente de IA de Google, Gemini, incorporó generación musical mediante Lyria 3, el modelo más reciente de Google DeepMind, permitiendo crear pistas de hasta 30 segundos a partir de texto, imágenes o video. Esta nueva función comenzó a desplegarse el 18 de febrero en versión beta para usuarios mayores de 18 años y aumenta las capacidades creativas de la plataforma más allá de la producción de texto, imágenes y clips audiovisuales.

Con esta integración, cualquiera puede describir un género, estado de ánimo o situación específica para obtener una canción con letra incluida. También es posible subir una foto o un video para que el sistema componga una pista acorde al contenido visual. Cada creación incluso incluye una portada generada por Nano Banana (el modelo de imágenes de Google).

Cómo funciona Lyria 3 en Gemini

De acuerdo con Google, Lyria 3 mejora frente a versiones anteriores al producir composiciones más realistas y con mayor complejidad musical. Además, crea letras de forma automática y ofrece mayor control sobre elementos como estilo, tempo e interpretación vocal, lo que permite ajustar con más precisión el resultado final.

Las pistas, eso sí, tienen una duración inicial de 30 segundos para los usuarios estándar. Los suscriptores de Google AI Plus, Pro y Ultra disponen de límites superiores, aunque la compañía no dejó en claro la extensión máxima en esos planes. La función está disponible en inglés, alemán, español, francés, hindi, japonés, coreano y portugués, con la idea de ampliar idiomas y cobertura. El despliegue comenzó en la versión de escritorio y se extenderá a la aplicación móvil en los días siguientes.

Integración con YouTube y verificación con SynthID

Otro punto muy relevante que comunicó la compañía, es que el modelo también se integró en Dream Track, la herramienta de YouTube destinada a crear bandas sonoras para Shorts. Hasta ahora, disponible en Estados Unidos, la función comenzó a expandirse a creadores en otros países, con el objetivo de facilitar la generación de pistas de acompañamiento y fragmentos vocales personalizados.

Todas las canciones creadas con Lyria 3 incorporan SynthID, la marca de agua imperceptible de Google para identificar contenido generado con inteligencia artificial. Además, Gemini añadió capacidades de verificación de audio: los usuarios pueden subir un archivo y solicitar al sistema que compruebe si contiene esa marca o si fue producido con herramientas de Google.