• Acerca de OhMyGeek!
  • Contacto
OhMyGeek!
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • Express en Canal 13C
    • OhMyGeek! en Radio Futuro
    • Spotify
    • Los Resistidos
    • Contáctanos
Sin resultados
Mira todos los resultados
OhMyGeek!
Menú
OhMyGeek!
Menú
Inicio Tecnologí­as Inteligencia Artificial

OpenAI dice que ChatGPT ahora podrá ver, escuchar e incluso hablar contigo

Por OhMyGeek!
25 de septiembre de 2023
ChatGPT
EnvíaloTuitéaloCompártelo

La creadora de ChatGPT, OpenAI, ha anunciado una serie de innovadoras características para su chatbot. Estas actualizaciones permiten al modelo «escuchar», «hablar», e incluso «ver» imágenes, marcando un hito en el mundo de la inteligencia artificial y transformando al chatbot en algo más que un asistente textual.

La capacidad de reconocimiento de voz e imagen en ChatGPT ofrecerá una interfaz más intuitiva, permitiendo a los usuarios tener una conversación por voz o mostrar imágenes al chatbot para discutir sobre ellas. Por ejemplo, un usuario podría tomar una foto de un monumento mientras viaja y tener una conversación en tiempo real sobre su historia o significado.

Además de estas características, ChatGPT ahora cuenta con síntesis de voz a texto y de texto a voz. Estas capacidades son impulsadas por un nuevo modelo de texto a voz que puede generar audio con calidad humana a partir de únicamente texto y unos segundos de muestra de voz. OpenAI colaboró con actores de voz profesionales para crear cada una de las voces disponibles.

CONTENIDO RELACIONADO

GPT-4.1 ya está disponible en ChatGPT para usuarios pagos y reemplaza al modelo mini anterior

Te explicamos la locura en redes sociales por los dibujos con estilo del Studio Ghibli por ChatGPT

OpenAI lanza «o3-mini», su nuevo modelo de razonamiento y en respuesta a DeepSeek

ChatGPT entenderá las fotos que le envíes

El reconocimiento de imágenes es otra característica destacada. Los usuarios pueden mostrar a ChatGPT una o más imágenes para discutir sobre ellas. Por ejemplo, podrían explorar el contenido de su nevera para planificar una comida o analizar un gráfico complejo para datos relacionados con el trabajo. Para centrarse en una parte específica de la imagen, los usuarios pueden utilizar la herramienta de dibujo en la aplicación móvil.

Sin embargo, estas avanzadas capacidades no están exentas de desafíos. OpenAI ha señalado que los modelos basados en visión presentan nuevos retos, desde alucinaciones sobre personas hasta depender de la interpretación del modelo de imágenes en dominios de alto riesgo. La empresa ha tomado medidas técnicas para limitar significativamente la capacidad de ChatGPT para analizar y hacer declaraciones directas sobre personas, ya que no siempre es preciso y estos sistemas deben respetar la privacidad de los individuos.

OpenAI enfatiza la importancia de desplegar estas capacidades de manera gradual, permitiendo mejoras y refinamientos en las mitigaciones de riesgos con el tiempo. Esta estrategia es aún más crucial con modelos avanzados que involucran voz e imagen.

Etiquetas: ChatGPTOpenAI

Síguenos en Google News:

Síguenos en:

Google News

Suscríbete a nuestro canal de WhatsApp:

Suscríbete en:

WhatsApp

ESTO TE INTERESARÁ

OpenAI

GPT-4.1 ya está disponible en ChatGPT para usuarios pagos y reemplaza al modelo mini anterior

14 de mayo de 2025
Christopher Pelkey Victima Ia

Víctima de asesinato es recreado con IA por su familia para usarlo en el juicio

8 de mayo de 2025
Gemini App Ipad - Gemini

Google lanza la App de Gemini optimizada para iPad con funciones exclusivas y multitarea

7 de mayo de 2025
Anthropic Claude Busqueda Web - Claude

Claude, el chatbot IA de Anthropic, ahora puede buscar en la Web

20 de marzo de 2025
OhMyGeek!

OhMyGeek! es un Web blog de tecnología, innovación y cultura Geek/Pop, con shows en televisión y radio. OhMyGeek! es una marca registrada de Producciones Medialabs Ltda.

(CC) 2025 OhMyGeek! Algunos derechos reservados.

  • RSS Feed
  • Acerca de OhMyGeek!
  • Contacto

Acerca de OhMyGeek!   /   Contacto

Sin resultados
Mira todos los resultados
  • Inicio
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • Express en Canal 13C
    • OhMyGeek! en Radio Futuro
    • Spotify
    • Los Resistidos
    • Contáctanos

Acerca de OhMyGeek!   /   Contacto