OpenAI ha llegado a un acuerdo con Reddit para usar las publicaciones de la plataforma como datos de entrenamiento para sus modelos de inteligencia artificial, incluido ChatGPT. Esta asociación permitirá a OpenAI acceder a contenido estructurado en tiempo real, como publicaciones y respuestas de Reddit, lo que mejorará la comprensión y la capacidad de respuesta de sus herramientas y modelos.
Este acuerdo también implica que OpenAI se convertirá en socio publicitario de la plataforma. La colaboración busca incorporar contenido de Reddit en ChatGPT y desarrollar nuevas funciones impulsadas por inteligencia artificial tanto para los usuarios como para los moderadores del servicio. OpenAI también proporcionará acceso a sus modelos de lenguaje avanzado para mejorar la experiencia del usuario en la plataforma.
El CEO de Reddit, Steve Huffman, destacó la autenticidad y diversidad de las conversaciones en su servicio, la convierten en una fuente valiosa para entrenar modelos de inteligencia artificial. Huffman comentó: «tenemos casi dos décadas de conversaciones auténticas, lo que representa una mina de oro para las compañías de inteligencia artificial generativa».
El uso de datos para entrenar modelos de IA genera inmediatas dudas sobre la privacidad y el uso de contenido generado por los usuarios. Aunque OpenAI asegura que únicamente utilizará datos públicos y respetará todas las normas de privacidad, la preocupación entre los usuarios sigue presente. Reddit ha sido vocal sobre su interés en acuerdos de licenciamiento de datos como parte central de su estrategia de crecimiento, especialmente tras su salida a bolsa.
El COO de OpenAI, Brad Lightcap, lideró el acuerdo, aprobado por la junta directiva independiente de OpenAI. Sam Altman, CEO de OpenAI y accionista significativo de Reddit, se abstuvo de participar en esta decisión debido a su participación en ambas empresas. Reddit ya ha hecho acuerdos similares con otras compañías, como con Google en febrero pasado, para licenciar sus datos y mejorar la eficiencia del entrenamiento de modelos de IA.