NVIDIA se enfrenta a una demanda colectiva propuesta por autores de libros que alegan que la plataforma de inteligencia artificial de la compañía, NeMo, se entrenó utilizando un conjunto de datos controvertido que copió y distribuyó ilegalmente sus libros sin su consentimiento.
Los novelistas Abdi Nazemian, Brian Keene y Stewart O’Nan demandan a NVIDIA que pague daños y destruya todas las copias del conjunto de datos Books3 utilizado para alimentar los modelos de lenguaje grandes (LLM) de NeMo. Este conjunto de datos, conocido como Books3, supuestamente copió «todo Bibliotek», una biblioteca pirata que contiene aproximadamente 196.640 libros pirateados.
¿NVIDIA a la par de los derechos de autor?
Los autores argumentan que la capacitación de los modelos NeMo en este conjunto de datos viola sus derechos exclusivos bajo la ley de derecho de autor. Alegan que NVIDIA ha seguido haciendo copias de las obras infringidas para entrenar otros modelos.
En respuesta, un portavoz de la compañía declaró al Wall Street Journal que la empresa respeta los derechos de todos los creadores de contenido y cree que NeMo fue creado en total cumplimiento de la ley de derechos de autor.
Este caso se presenta en medio de una creciente preocupación por la transparencia en el entrenamiento de modelos de IA y sigue a demandas similares contra OpenAI y Microsoft por parte de autores de no ficción y organizaciones de noticias. Los litigios en curso sugieren un escrutinio cada vez mayor sobre la legalidad de los conjuntos de datos utilizados para entrenar modelos de IA generativa, lo que puede tener amplias implicaciones para la industria de la tecnología.