Reddit toma medidas legales contra empresas que recolectan sus datos a gran escala

Reddit toma medidas legales contra empresas que recolectan sus datos a gran escala

Reddit ha presentado una demanda contra cuatro compañías, incluyendo el motor de búsqueda de IA Perplexity y la firma de datos SEO SerpApi, acusándolas de scraping ilegal de su contenido a través de Google Search.

Según el documento legal presentado en el Tribunal de Distrito Sur de Nueva York, estas empresas habrían recolectado información de Reddit a “escala industrial”, disfrazando sus bots para evitar restricciones técnicas.

De qué acusa Reddit

La demanda alega que Perplexity, SerpApi, Oxylabs y AWMProxy diseñaron un esquema para recolectar datos indirectamente mediante Google y luego, los revendieron o los reutilizaron para entrenar modelos de inteligencia artificial.

Reddit incluso afirma haber creado un post trampa visible solo para el rastreador de Google, que apareció en los resultados de Perplexity en pocas horas, evidenciando el uso de datos scrapeados.

Motivación detrás de la demanda

Reddit ya tiene acuerdos de licencia de datos con OpenAI y Google, pero la compañía afirma que estas otras empresas han intentado eludir esos contratos.

La demanda busca compensación financiera, una orden judicial permanente y la prohibición de usar o vender datos previamente scrapeados.

Impacto en SEO y tráfico web

Este caso refleja un entorno cada vez más difícil para SEOs y creadores de contenido, con restricciones más estrictas por parte de Google y el surgimiento de “zero-click results” en la búsqueda.

Mientras los sistemas de IA recopilan grandes volúmenes de datos, generan muy poco tráfico real hacia los sitios web:

  • Google envía 831 veces más visitantes que los sistemas de IA, según TollBit.
  • La relación de rastreos frente a visitantes: Google 18:1, OpenAI 1.500:1, Anthropic 60.000:1.

El futuro de la colaboración entre Reddit y Google

Reddit y Google están en conversaciones para integrar contenido de Reddit directamente en productos de IA de Google, lo que podría cambiar significativamente cómo se muestra el contenido de Reddit y cómo influye en la visibilidad de marcas y tráfico web.

Reddit ya denuncio todo esto con anterioridad

Conclusión

La demanda de Reddit subraya los desafíos que enfrentan los creadores de contenido en la era de la IA generativa y el scraping masivo, marcando un precedente sobre cómo las empresas de datos deben interactuar legalmente con el contenido de terceros.