• Acerca de OhMyGeek!
  • Contacto
OhMyGeek!
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast
Sin resultados
Mira todos los resultados
OhMyGeek!
Menú
OhMyGeek!
Menú
Inicio Tecnologí­as Inteligencia Artificial

OpenAI dice que ChatGPT ahora podrá ver, escuchar e incluso hablar contigo

Redacción OhMyGeek! Por Redacción OhMyGeek!
25 septiembre 2023
ChatGPT
EnvíaloTuitéaloCompártelo

La creadora de ChatGPT, OpenAI, ha anunciado una serie de innovadoras características para su chatbot. Estas actualizaciones permiten al modelo «escuchar», «hablar», e incluso «ver» imágenes, marcando un hito en el mundo de la inteligencia artificial y transformando al chatbot en algo más que un asistente textual.

La capacidad de reconocimiento de voz e imagen en ChatGPT ofrecerá una interfaz más intuitiva, permitiendo a los usuarios tener una conversación por voz o mostrar imágenes al chatbot para discutir sobre ellas. Por ejemplo, un usuario podría tomar una foto de un monumento mientras viaja y tener una conversación en tiempo real sobre su historia o significado.

Además de estas características, ChatGPT ahora cuenta con síntesis de voz a texto y de texto a voz. Estas capacidades son impulsadas por un nuevo modelo de texto a voz que puede generar audio con calidad humana a partir de únicamente texto y unos segundos de muestra de voz. OpenAI colaboró con actores de voz profesionales para crear cada una de las voces disponibles.

CONTENIDO RELACIONADO

ChatGPT llega a CarPlay con interacción solo por voz en iOS 26.4

OpenAI termina con «Sora», su app de video con IA, tras solo seis meses de existir

¿Qué cambia con GPT-5.4? El nuevo modelo de OpenAI para programación y análisis de datos

ChatGPT entenderá las fotos que le envíes

El reconocimiento de imágenes es otra característica destacada. Los usuarios pueden mostrar a ChatGPT una o más imágenes para discutir sobre ellas. Por ejemplo, podrían explorar el contenido de su nevera para planificar una comida o analizar un gráfico complejo para datos relacionados con el trabajo. Para centrarse en una parte específica de la imagen, los usuarios pueden utilizar la herramienta de dibujo en la aplicación móvil.

Sin embargo, estas avanzadas capacidades no están exentas de desafíos. OpenAI ha señalado que los modelos basados en visión presentan nuevos retos, desde alucinaciones sobre personas hasta depender de la interpretación del modelo de imágenes en dominios de alto riesgo. La empresa ha tomado medidas técnicas para limitar significativamente la capacidad de ChatGPT para analizar y hacer declaraciones directas sobre personas, ya que no siempre es preciso y estos sistemas deben respetar la privacidad de los individuos.

OpenAI enfatiza la importancia de desplegar estas capacidades de manera gradual, permitiendo mejoras y refinamientos en las mitigaciones de riesgos con el tiempo. Esta estrategia es aún más crucial con modelos avanzados que involucran voz e imagen.

Etiquetas: ChatGPTOpenAI

Síguenos en Google News:

Síguenos en:

Google News

Suscríbete a nuestro canal de WhatsApp:

Suscríbete en:

WhatsApp
Redacción OhMyGeek!

Redacción OhMyGeek!

Equipo editorial de OhMyGeek!. Cubrimos los lanzamientos globales más relevantes en ciencia, tecnología y cultura digital.

ESTO TE INTERESARÁ

ElevenMusic ElevenLabs App

ElevenMusic: así es la nueva app de ElevenLabs para crear y escuchar música con IA

6 abril 2026
Planta electrica a gas natural

Gigantes tecnológicos recurren al gas natural para energizar sus centros de datos de inteligencia artificial

5 abril 2026
ChatGPT CarPlay

ChatGPT llega a CarPlay con interacción solo por voz en iOS 26.4

2 abril 2026
Claude Code Codigo Fuente

¡Otra vez! Claude Code filtra su código fuente por error en npm

31 marzo 2026
OhMyGeek!

OhMyGeek! es un Web blog de tecnología, innovación y cultura Geek/Pop, con shows en televisión y radio. OhMyGeek! es una marca registrada de Producciones Medialabs Ltda.

(CC) 2025 OhMyGeek! Algunos derechos reservados.

  • RSS Feed
  • Acerca de OhMyGeek!
  • Contacto

Acerca de OhMyGeek!   /   Contacto

Sin resultados
Mira todos los resultados
  • Inicio
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Noticias los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast

Acerca de OhMyGeek!   /   Contacto