• Acerca de OhMyGeek!
  • Contacto
OhMyGeek!
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Todos los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast
Sin resultados
Mira todos los resultados
OhMyGeek!
Menú
OhMyGeek!
Menú
Inicio Tecnologí­as

Apple, NVIDIA y Anthropic usaron miles de transcripciones de videos de YouTube para entrenar IA

Y esta no es la primera vez que descubren el scraping no autorizado de videos.

Redacción OhMyGeek! Por Redacción OhMyGeek!
17 julio 2024
canal de YouTube
EnvíaloTuitéaloCompártelo

Apple, NVIDIA y Anthropic fueron descubiertas utilizando transcripciones de YouTube —sin permiso— para entrenar modelos de IA. Esto fue presentado gracias a una investigación reciente de Proof News, demostrando que estas empresas ocuparon un dataset creado por «EleutherAI» que incluía transcripciones de más de 173.000 videos de YouTube, extraídas de más de 48.000 canales.

Sin el consentimiento de los creadores, este dataset conocido como «YouTube Subtitles», contiene transcripciones de videos de canales educativos como Khan Academy, MIT y Harvard, así como de medios de comunicación como NPR y BBC. Incluso de famosos youtubers como MrBeast, Marques Brownlee y PewDiePie.

El uso de transcripciones de YouTube ha generado controversia entre los creadores de contenido. David Pakman, anfitrión de un canal político en YouTube, declaró que casi 160 de sus videos fueron utilizados sin su conocimiento, destacando que esta práctica afecta su sustento. Similarmente, Julia Walsh, CEO de la productora Complexly, expresó su frustración por el uso no autorizado de su contenido educativo.

RELACIONADO:

Intel fabricará chips para Apple en Estados Unidos tras un anuncio de Trump

Apple admite lo peor: la escasez de chips los afecta y aumentarán los precios de sus equipos

¿Por qué Anthropic fue obligado a apagar Mythos 5 y Fable 5 por el gobierno de EE. UU.?

¿Qué dicen del ‘robo’ de transcripciones?

Los representantes de las compañías implicadas, como Apple, Nvidia y EleutherAI, no han proporcionado comentarios específicos sobre esta investigación. Por otro lado, Jennifer Martinez, portavoz de Anthropic, afirmó que el dataset utilizado es sólo una pequeña parte de los subtítulos de YouTube y no viola directamente los términos de servicio de YouTube.

Sin embargo, Google ha tomado medidas para prevenir el scraping no autorizado de datos, aunque no entregaron detalles de cómo lo hacen. De igual forma, recordemos que en abril pasado el CEO de YouTube, Neal Mohan, emitió una advertencia —en aquel entonces— a OpenAI respecto al uso de los videos de la plataforma. Dejando en claro que los términos de servicio de la plataforma de videos prohíben explícitamente la descarga de transcripciones o fragmentos de clips.

El dataset «YouTube Subtitles» forma parte de «The Pile», una colección más amplia de datos accesibles y utilizados tanto por grandes corporaciones como por desarrolladores independientes. Esta práctica ha sido criticada anteriormente y ha llevado a demandas legales por violaciones de derechos de propiedad intelectual, aunque estas demandas aún no se han resuelto en los tribunales.

Mira más sobre: AnthropicAppleNVIDIAYouTube

Síguenos en Google News:

Síguenos en:

Google News

Suscríbete a nuestro canal de WhatsApp:

Suscríbete en:

WhatsApp

LO ÚLTIMO

Valve Steam Machine
Videojuegos

Steam Machine ya tiene precio, pero conseguir una podría ser más difícil de lo esperado

Por Felipe Ovalle
22 junio 2026

Lee másDetails

Uber fue demandada por sus accionistas acusando fallas en supervisar casos de abuso sexual

China acusa que tortugas espías con sensores recopilan información sensible en sus aguas

Google Home Speaker ya tiene precio y fecha: así es el nuevo parlante inteligente con Gemini

Zuckerberg y Bezos sufren de burlas por Donald Trump al compartir mensajes privados

Crean una pintura de color negro para automóviles que absorbe casi toda la luz

LO ÚLTIMO

Valve Steam Machine

Steam Machine ya tiene precio, pero conseguir una podría ser más difícil de lo esperado

22 junio 2026
Oficinas de Uber

Uber fue demandada por sus accionistas acusando fallas en supervisar casos de abuso sexual

22 junio 2026

China acusa que tortugas espías con sensores recopilan información sensible en sus aguas

20 junio 2026

Google Home Speaker ya tiene precio y fecha: así es el nuevo parlante inteligente con Gemini

19 junio 2026

Zuckerberg y Bezos sufren de burlas por Donald Trump al compartir mensajes privados

19 junio 2026

Crean una pintura de color negro para automóviles que absorbe casi toda la luz

19 junio 2026

OHMYGEEK! TV

Redacción OhMyGeek!

Redacción OhMyGeek!

Equipo editorial de OhMyGeek!. Cubrimos los lanzamientos globales más relevantes en ciencia, tecnología y cultura digital.

ESTO TE INTERESARÁ

Google Home Speaker

Google Home Speaker ya tiene precio y fecha: así es el nuevo parlante inteligente con Gemini

19 junio 2026
color negro ultraprofundo Matter & Light

Crean una pintura de color negro para automóviles que absorbe casi toda la luz

19 junio 2026
iPhone 18 Pro Precio Diamantes

¿Cuánto podría subir el precio del iPhone 18? Estimaciones apuntan hasta $270 USD más caro

19 junio 2026
Apple M6 Intel

Intel fabricará chips para Apple en Estados Unidos tras un anuncio de Trump

18 junio 2026
Tim Cook Apple Chips RAM

Apple admite lo peor: la escasez de chips los afecta y aumentarán los precios de sus equipos

18 junio 2026
Registro de Vandalos Rifas Bingos Sorteos

Registro de Vándalos pone bajo la lupa las rifas por redes sociales y los bingos solidarios

16 junio 2026
OhMyGeek!

OhMyGeek! es un Web blog de tecnología, innovación y cultura Geek/Pop, con shows en televisión y radio. OhMyGeek! es una marca registrada de Producciones Medialabs Ltda.

(CC) 2026 OhMyGeek! Algunos derechos reservados.

  • RSS Feed
  • Acerca de OhMyGeek!
  • Contacto

Acerca de OhMyGeek!   /   Contacto

Sin resultados
Mira todos los resultados
  • Inicio
  • Noticias
    • Ciencia
    • Dispositivos
    • Hardware
    • Inteligencia Artificial
    • Internet
    • Robótica
    • Seguridad
    • Software
    • Verdes
  • Acerca de
    • Apple
    • Eventos
    • Google
    • Industria
    • Microsoft
    • Redes 5G
    • Samsung
    • Transportes
    • Tutoriales
  • Entretenimiento
    • Cultura Pop
    • Música
    • No-Noticia
    • Películas
    • Series
    • Videojuegos
  • Videos
    • Noticias los videos
    • YouTube
    • Instagram
    • TikTok
  • OhMyGeek!
    • Análisis
    • ECHO
    • Express en Canal 13C
    • Los Resistidos
    • Podcast

Acerca de OhMyGeek!   /   Contacto