Wikipedia ha deciso di affrontare di petto la sfida dell’intelligenza artificiale, proponendo un modello che vuole garantire la sopravvivenza della sua enciclopedia nell’era dei chatbot generativi.
La Wikimedia Foundation, che gestisce il progetto, ha infatti invitato le aziende di intelligenza artificiale a smettere di prelevare i suoi contenuti attraverso lo scraping e a utilizzare invece la piattaforma a pagamento Wikimedia Enterprise, pensata proprio per un accesso strutturato e sostenibile ai dati.
Col termine “scraping” si indica l’estrazione automatica di grandi quantità di testi o immagini da un sito web, spesso senza autorizzazione. È una pratica alla base dell’addestramento dei modelli fondazionali come ChatGPT o Gemini, che hanno bisogno di enormi quantità di informazioni per funzionare.
Il problema, secondo Wikipedia, è che questo processo grava sui suoi server e sfrutta il lavoro di milioni di volontari senza alcun ritorno economico o visibilità.
Il picco di traffico “fantasma”
Negli ultimi mesi la Wikimedia Foundation ha notato un’anomalia nel traffico verso il proprio sito. Dopo aver potenziato i sistemi di rilevamento, ha scoperto che l’impennata di visite registrata tra maggio e giugno era in realtà dovuta a bot di intelligenza artificiale che cercavano di “sfuggire al rilevamento” fingendosi utenti umani.
Parallelamente, le visualizzazioni reali, ovvero quelle generate dalle persone, sono calate dell’8% rispetto all’anno precedente.
Il post della Fondazione non minaccia sanzioni o azioni legali ma traccia una linea chiara. Le aziende di intelligenza artificiale devono utilizzare i contenuti “in modo responsabile”, con un’adeguata attribuzione e preferibilmente attraverso Wikimedia Enterprise.
L’obiettivo è duplice: evitare di sovraccaricare i server e permettere alle aziende di sostenere la missione no profit di Wikipedia, che vive di donazioni e lavoro volontario.
L’appello: dare credito al lavoro umano
“Affinché le persone possano fidarsi delle informazioni condivise su internet, le piattaforme dovrebbero rendere chiara la provenienza dei dati e offrire la possibilità di visitare e partecipare direttamente alle fonti”, si legge nel post ufficiale.
Per Wikipedia, il rischio non è solo economico ma anche culturale. Meno visite significano meno volontari pronti a migliorare le voci e meno donatori disposti a contribuire, in un circolo vizioso che potrebbe indebolire una delle ultime grandi opere collettive del web aperto.
La mossa di Wikipedia arriva in un momento di tensione crescente tra i produttori di contenuti e le aziende che sviluppano modelli generativi.
Da un lato, i colossi dell’IA dipendono da fonti aperte per addestrare i propri modelli. Dall’altro, sempre più editori hanno iniziato a chiedere compensi per l’uso del loro materiale.
Con la sua piattaforma a pagamento, Wikimedia cerca una via di mezzo: continuare a condividere conoscenza liberamente, ma in modo sostenibile e trasparente.
Fonte: TechCrunch


