Reddit Demanda a Anthropic por Usar Comentarios para Entrenar a Claude

Reddit ha presentado una demanda contra la empresa de inteligencia artificial Anthropic, acusándola de extraer ilegalmente comentarios de usuarios para entrenar a su chatbot Claude. La plataforma de redes sociales alega que Anthropic utilizó bots automatizados para acceder al contenido de Reddit, incluso después de que se le solicitara que no lo hiciera. Reddit afirma que Anthropic “entrenó intencionalmente sus sistemas con los datos personales de los usuarios de Reddit sin solicitar su consentimiento”.

Acusaciones y Defensa de Anthropic

Anthropic ha negado las acusaciones de Reddit y ha declarado que se defenderá enérgicamente. Según los documentos presentados ante el Tribunal Superior de California en San Francisco, Reddit alega que Anthropic accedió a su plataforma más de 100,000 veces desde julio de 2024, después de haber afirmado que había bloqueado sus bots.

El Valor del Contenido Humano

Ben Lee, jefe del departamento legal de Reddit, enfatizó la importancia del contenido generado por los usuarios de Reddit, declarando que la “explotación comercial” de este contenido por parte de Anthropic podría valer miles de millones de dólares. Añadió que las conversaciones que se dan en Reddit no se replican en ningún otro sitio y que son centrales para el entrenamiento de modelos de lenguaje como Claude.

Reddit ya ha llegado a acuerdos de licencia con empresas como Google y OpenAI, que pagan para poder entrenar sus sistemas de IA con los comentarios públicos de los más de 100 millones de usuarios diarios de Reddit. Estos acuerdos permiten a Reddit proteger a sus usuarios, garantizando el derecho a eliminar contenido y la protección de la privacidad.

Implicaciones para el Futuro de la IA

La demanda de Reddit contra Anthropic plantea importantes interrogantes sobre los límites de la recopilación de datos para el entrenamiento de modelos de IA y la necesidad de proteger los derechos de los usuarios. Este caso podría establecer un precedente importante para el futuro de la IA y la forma en que las empresas acceden y utilizan los datos generados por los usuarios en plataformas online.

Compartir artículo