La comediante y actriz Sarah Silverman, junto a los autores Christopher Golden y Richard Kadrey, están demandando a Meta y al fabricante de ChatGPT, OpenAI, alegando que los modelos de lenguaje de IA de las compañías fueron entrenados en materiales con derechos de autor de sus libros sin su conocimiento o consentimiento. La acusación apunta directamente a las inteligencias artificiales ChatGPT y LLaMA.
El documento judicial contra OpenAI afirma que «cuando se solicita a ChatGPT, ChatGPT genera resúmenes de las obras con derechos de autor de los demandantes, algo que sólo es posible si ChatGPT fue entrenado en las obras con derechos de autor de los demandantes». Los autores «no consintieron el uso de sus libros con derechos de autor como material de entrenamiento para ChatGPT», incluye la denuncia en su texto.
La demanda contra Meta afirma que la compañía utilizó los libros con derechos de autor de los autores para entrenar a LLaMA, el conjunto de grandes modelos de lenguaje lanzados por Meta en febrero. La documentación afirma que gran parte del material empleado para entrenar los modelos de lenguaje de Meta «proviene de obras con derechos de autor, incluidos libros escritos por los demandantes, que fueron copiados por Meta sin consentimiento, sin crédito y sin compensación». La demanda contra Meta también alega que la compañía accedió a los libros con derechos de autor a través de una Web estilo ‘biblioteca sombra’ que incluye una gran cantidad de material con derechos de autor (básicamente pirateado).
Meta se negó a comentar sobre la demanda a los medios que los consultaron. Por su parte, OpenAI no ha respondido oficialmente.
La acción legal por parte de Silverman no es la primera en centrarse en cómo se entrenan los grandes modelos de lenguaje. Una demanda separada presentada contra OpenAI el mes pasado alegó que la compañía apropió indebidamente grandes extensiones de datos personales de personas en Internet para entrenar sus herramientas AI.