• Acerca de OhMyGeek!
  • Contacto
OhMyGeek!
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast
Sin resultados
Mira todos los resultados
OhMyGeek!
Menú
OhMyGeek!
Menú
Inicio Tecnologí­as Inteligencia Artificial

OpenAI dice que ChatGPT ahora podrá ver, escuchar e incluso hablar contigo

Por OhMyGeek!
25 de septiembre de 2023
ChatGPT
EnvíaloTuitéaloCompártelo

La creadora de ChatGPT, OpenAI, ha anunciado una serie de innovadoras características para su chatbot. Estas actualizaciones permiten al modelo «escuchar», «hablar», e incluso «ver» imágenes, marcando un hito en el mundo de la inteligencia artificial y transformando al chatbot en algo más que un asistente textual.

La capacidad de reconocimiento de voz e imagen en ChatGPT ofrecerá una interfaz más intuitiva, permitiendo a los usuarios tener una conversación por voz o mostrar imágenes al chatbot para discutir sobre ellas. Por ejemplo, un usuario podría tomar una foto de un monumento mientras viaja y tener una conversación en tiempo real sobre su historia o significado.

Además de estas características, ChatGPT ahora cuenta con síntesis de voz a texto y de texto a voz. Estas capacidades son impulsadas por un nuevo modelo de texto a voz que puede generar audio con calidad humana a partir de únicamente texto y unos segundos de muestra de voz. OpenAI colaboró con actores de voz profesionales para crear cada una de las voces disponibles.

CONTENIDO RELACIONADO

OpenAI lanza ChatGPT for Teachers, la versión gratuita del chatbot para profesores

OpenAI estaría trabajando en un generador de música basado en texto y voz

La App de Sora alcanza un millón de descargas en menos de cinco días

ChatGPT entenderá las fotos que le envíes

El reconocimiento de imágenes es otra característica destacada. Los usuarios pueden mostrar a ChatGPT una o más imágenes para discutir sobre ellas. Por ejemplo, podrían explorar el contenido de su nevera para planificar una comida o analizar un gráfico complejo para datos relacionados con el trabajo. Para centrarse en una parte específica de la imagen, los usuarios pueden utilizar la herramienta de dibujo en la aplicación móvil.

Sin embargo, estas avanzadas capacidades no están exentas de desafíos. OpenAI ha señalado que los modelos basados en visión presentan nuevos retos, desde alucinaciones sobre personas hasta depender de la interpretación del modelo de imágenes en dominios de alto riesgo. La empresa ha tomado medidas técnicas para limitar significativamente la capacidad de ChatGPT para analizar y hacer declaraciones directas sobre personas, ya que no siempre es preciso y estos sistemas deben respetar la privacidad de los individuos.

OpenAI enfatiza la importancia de desplegar estas capacidades de manera gradual, permitiendo mejoras y refinamientos en las mitigaciones de riesgos con el tiempo. Esta estrategia es aún más crucial con modelos avanzados que involucran voz e imagen.

Etiquetas: ChatGPTOpenAI

Síguenos en Google News:

Síguenos en:

Google News

Suscríbete a nuestro canal de WhatsApp:

Suscríbete en:

WhatsApp

ESTO TE INTERESARÁ

Banana Fish - Banana Fish, Amazon

Amazon provoca indignación por doblajes hechos con IA para «Banana Fish»

1 de diciembre de 2025
Chatbot Ia Poesia Bomba Nuclear - poesía

Decir una poesía hace que los chatbots IA te digan cómo construir una bomba nuclear

30 de noviembre de 2025
Suno Warner Music Group

Suno y Warner Music cierran un trato histórico tras un año de demandas

25 de noviembre de 2025
Claude Opus 4.5 - Opus 4.5

Opus 4.5: el modelo de Anthropic que supera a GPT-5.1 en precisión de código

24 de noviembre de 2025
OhMyGeek!

OhMyGeek! es un Web blog de tecnología, innovación y cultura Geek/Pop, con shows en televisión y radio. OhMyGeek! es una marca registrada de Producciones Medialabs Ltda.

(CC) 2025 OhMyGeek! Algunos derechos reservados.

  • RSS Feed
  • Acerca de OhMyGeek!
  • Contacto

Acerca de OhMyGeek!   /   Contacto

Sin resultados
Mira todos los resultados
  • Inicio
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast

Acerca de OhMyGeek!   /   Contacto