InicioAIWikimedia bajo presión: aumento del tráfico del 50% por culpa de los...

Wikimedia bajo presión: aumento del tráfico del 50% por culpa de los bots AI

neopepe presale now live

En el corazón del universo digital del conocimiento libre, Wikimedia se enfrenta hoy a uno de los desafíos más complejos de su historia reciente: la creciente ola de bots automáticos AI que saquean sistemáticamente sus contenidos. 

En particular, en los últimos meses se ha producido un aumento del 50% del tráfico generado por los llamados crawler AI, que está poniendo a prueba tanto la capacidad técnica como la sostenibilidad económica de la plataforma.

Crece el impacto de la inteligencia artificial (AI) en las infraestructuras digitales: el caso Wikimedia

A partir de enero de 2024, se ha registrado un crecimiento vertiginoso en el volumen de datos descargados de plataformas como Wikipedia y los otros proyectos Wikimedia. 

Este incremento no es atribuible a una mayor participación de los usuarios humanos, sino a un uso sistemático y a menudo poco regulado de bots automáticos empleados por empresas que desarrollan modelos de inteligencia artificial.

Estos instrumentos, diseñados para recopilar y analizar grandes cantidades de texto, imágenes y otros contenidos, utilizan Wikimedia como una fuente primaria de datos para el entrenamiento de sus algoritmos

Una operación que, si por un lado testimonia la centralidad de la plataforma en el ecosistema del conocimiento digital, por otro ejerce una presión insostenible sobre sus infraestructuras informáticas.

El problema no reside solo en la cantidad de datos transferidos. El verdadero punto crítico está representado por la manera en que estos bots acceden a los contenidos. 

En la mayoría de los casos, de hecho, las solicitudes están dirigidas a páginas raras o poco visitadas, es decir, aquellas que no están incluidas en los sistemas de caching. Es decir, mecanismos que permiten conservar temporalmente copias de las páginas más consultadas para acelerar su carga.

Cuando esto sucede, las solicitudes deben ser gestionadas directamente por los servidores centrales, determinando un aumento significativo de la carga de trabajo y, sobre todo, de los costos. 

Este escenario se vuelve particularmente crítico en coincidencia con eventos de gran relevancia mediática, durante los cuales el tráfico “humano” ya alcanza niveles elevados.

Bots fuera de control: ignoran las reglas, eluden los bloqueos

Otra dimensión alarmante del fenómeno está representada por el comportamiento cada vez más sofisticado y, a veces, incorrecto de los crawler. Muchos de estos bots, de hecho, ignoran las convenciones establecidas, eluden los sistemas de bloqueo automático y se camuflan para parecer usuarios legítimos.

Este tipo de conducta no solo viola las normas de buen uso de la red, sino que obliga a los equipos técnicos de Wikimedia a una vigilancia continua y a un uso constante de recursos para proteger la infraestructura. 

Recursos que podrían ser en cambio destinados a potenciar la plataforma o a enriquecer sus contenidos.

En respuesta a esta situación, la Fundación Wikimedia está tratando de no limitarse a una reacción técnica o defensiva. La solución propuesta va más allá del simple contención del problema y apunta a una gestión colaborativa y sostenible del saber libre.

Así nace WE5, una nueva iniciativa estratégica que tiene el objetivo de promover enfoques más equitativos y responsables en la adquisición y el uso de los datos alojados en la plataforma. 

El proyecto se presenta como una invitación a las empresas tech y a los desarrolladores de inteligencia artificial. 

En específico, una invitación a respetar las reglas, contribuir a los costos de gestión de la red y garantizar la supervivencia de la infraestructura sobre la cual se basa una de las principales fuentes de información libre del mundo.

Todo el asunto plantea una cuestión crucial para el futuro del acceso libre al conocimiento: en una época en la que los datos se han convertido en la savia vital de la inteligencia artificial, ¿quién paga por la conservación y la distribución de esos datos?

Wikimedia, siempre animada por el principio de la gratuidad y del intercambio, se encuentra ahora en la encrucijada entre apertura y sostenibilidad.

Sin un cambio de rumbo por parte de las grandes tecnológicas y de los actores que utilizan masivamente los contenidos de la fundación, el proyecto podría verse obligado a reducir la accesibilidad o a introducir límites más estrictos para salvaguardar su infraestructura.

Un llamamiento al respeto del bien público digital

El mensaje que Wikimedia lanza al mundo es claro. Es decir, que el conocimiento libre es un bien común y, como tal, debe ser tratado con respeto y responsabilidad.

El uso con fines comerciales del enorme patrimonio informativo puesto a disposición por la fundación debe realizarse de forma transparente, conforme a las reglas y. Además, si es necesario, acompañado de formas de contribución equitativa.

En un panorama digital cada vez más dominado por algoritmos y automatización, es fundamental garantizar que el acceso al conocimiento no se vea comprometido por los intereses económicos de pocos. 

Solo a través de un diálogo abierto entre comunidades, instituciones y empresas será posible mantener vivo el sueño de una enciclopedia global libre, accesible y sostenible.

RELATED ARTICLES

Stay updated on all the news about cryptocurrencies and the entire world of blockchain.

- Advertisment -spot_img

LATEST