• Acerca de OhMyGeek!
  • Contacto
OhMyGeek!
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast
Sin resultados
Mira todos los resultados
OhMyGeek!
Menú
OhMyGeek!
Menú
Inicio Tecnologí­as Inteligencia Artificial

EMO: una IA que toma el rostro de una foto y la hace cantar o hablar según el audio que uses

Y no necesita de puntos de referencias o modelos 3D para realizar la animación.

Redacción OhMyGeek! Por Redacción OhMyGeek!
8 marzo 2024
EnvíaloTuitéaloCompártelo

EMO, abreviatura de «Emote Portrait Alive», es una innovadora tecnología de inteligencia artificial desarrollada por investigadores chinos del Instituto de Computación Inteligente de Alibaba Group. Sí, la mismísima empresa madre de AliExpress. Y su principal función es animar fotos estáticas de retratos, permitiendo que los sujetos representados en ellas hablen o canten de manera realista​​​​.

Esta tecnología se distingue por su enfoque único en la animación. A diferencia de los métodos convencionales, EMO convierte directamente las ondas de audio en cuadros de video, sin necesidad de modelos intermedios en 3D o puntos de referencia en el rostro, capturando movimientos faciales sutiles y estilos faciales individuales asociados con el habla natural​​.

La IA de EMO utiliza un modelo de difusión para generar imágenes sintéticas realistas. Se entrenó utilizando un vasto conjunto de datos de videos de cabezas parlantes de diversas fuentes, lo que le permite producir videos de alta calidad que conservan la identidad del sujeto y transmiten expresividad. Además de generar videos de conversación, EMO también puede animar retratos cantantes, sincronizando las formas de la boca y las expresiones faciales con las vocales para crear videos de canto en diferentes estilos y duraciones​​.

RELACIONADO:

Copia sellada de Super Mario Bros. se vendió por 3 millones de dólares gracias a un detalle en su caja

EE. UU. suma a BYD, Alibaba y otras empresas a su lista de «compañías militares chinas»

El drone Blackbird alcanzó 730 km/h y dejó atrás el récord Guinness vigente

Emo Emote Portrait Alive - EMO

EMO desde un audio logra microexpresiones realistas

La tecnología de este proyecto es un avance importante en la animación artificial, ya que convierte fotos completamente estáticas en vivos videos donde los sujetos parecen hablar o cantar de manera realista, incluso con microexpresiones. Esto se logra convirtiendo directamente el audio en fotogramas de video, lo que permite capturar de manera precisa las expresiones faciales y los movimientos​​.

Los investigadores han publicado un artículo científico en la plataforma arXiv para explicar cómo es la generación de videos explícitamente desde el audio que se le quiere adjuntar, incluyendo una serie de ejemplos audiovisuales que involucran a una Audrey Hepburn cantando o una Mona Lisa haciendo un monólogo de Shakespeare. Incluso al guasón de Joaquin Phoenix, pero diciendo una línea de diálogo de la versión del personaje de Heath Ledger, tal como te mostramos en nuestra cápsula del Express (al inicio del artículo).

Sin embargo, aunque EMO ofrece estas posibilidades para la creación de contenido de video personalizado, también presenta preocupaciones éticas, como la suplantación de identidad o la difusión de información errónea. Es fundamental abordar la implementación de esta tecnología con precaución y asegurar que se establezcan cánones adecuados para abordar estas preocupaciones​​.

Mira más sobre: AlibabaOhMyGeek! Express

Síguenos en Google News:

Síguenos en:

Google News

Suscríbete a nuestro canal de WhatsApp:

Suscríbete en:

WhatsApp

LO ÚLTIMO

Tortugas
No-Noticia

China acusa que tortugas espías con sensores recopilan información sensible en sus aguas

Por Redacción OhMyGeek!
20 junio 2026

Lee másDetails

Google Home Speaker ya tiene precio y fecha: así es el nuevo parlante inteligente con Gemini

Zuckerberg y Bezos sufren de burlas por Donald Trump al compartir mensajes privados

Crean una pintura de color negro para automóviles que absorbe casi toda la luz

¿Cuánto podría subir el precio del iPhone 18? Estimaciones apuntan hasta $270 USD más caro

Intel fabricará chips para Apple en Estados Unidos tras un anuncio de Trump

LO ÚLTIMO

Tortugas

China acusa que tortugas espías con sensores recopilan información sensible en sus aguas

20 junio 2026
Google Home Speaker

Google Home Speaker ya tiene precio y fecha: así es el nuevo parlante inteligente con Gemini

19 junio 2026

Zuckerberg y Bezos sufren de burlas por Donald Trump al compartir mensajes privados

19 junio 2026

Crean una pintura de color negro para automóviles que absorbe casi toda la luz

19 junio 2026

¿Cuánto podría subir el precio del iPhone 18? Estimaciones apuntan hasta $270 USD más caro

19 junio 2026

Intel fabricará chips para Apple en Estados Unidos tras un anuncio de Trump

18 junio 2026

OHMYGEEK! TV

Redacción OhMyGeek!

Redacción OhMyGeek!

Equipo editorial de OhMyGeek!. Cubrimos los lanzamientos globales más relevantes en ciencia, tecnología y cultura digital.

ESTO TE INTERESARÁ

Shrek 5

El primer tráiler de Shrek 5 muestra por primera vez a la familia, pero aun sin Zendaya

16 junio 2026
Claude Flable Mythos 5 Prohibidos

¿Por qué Anthropic fue obligado a apagar Mythos 5 y Fable 5 por el gobierno de EE. UU.?

13 junio 2026
trump phone t1 HTC U24 Pro

El Trump phone resulta ser casi idéntico a un smartphone HTC lanzado dos años antes

11 junio 2026
Nintendo Direct Junio 2026

Nintendo Direct vuelve este 9 de junio con foco en los juegos de Switch 2 para el resto del 2026

8 junio 2026
Apple WWDC 2026 Cook Ternus

Mira en vivo la WWDC 2026 de Apple esperando la nueva Siri y las novedades en IA y los SO

8 junio 2026
MSI MEG Vision X2 AI+

MSI convierte su nuevo PC gamer en un asistente con avatar: así es el MEG Vision X2 AI+

3 junio 2026
OhMyGeek!

OhMyGeek! es un Web blog de tecnología, innovación y cultura Geek/Pop, con shows en televisión y radio. OhMyGeek! es una marca registrada de Producciones Medialabs Ltda.

(CC) 2026 OhMyGeek! Algunos derechos reservados.

  • RSS Feed
  • Acerca de OhMyGeek!
  • Contacto

Acerca de OhMyGeek!   /   Contacto

Sin resultados
Mira todos los resultados
  • Inicio
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Noticias los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast

Acerca de OhMyGeek!   /   Contacto