Wikipedia dice basta allo scraping: “Usate la nostra API a pagamento”

da | 11 Nov 2025 | IA

Tempo di lettura: 2 minuti

Wikipedia ha deciso di affrontare di petto la sfida dell’intelligenza artificiale, proponendo un modello che vuole garantire la sopravvivenza della sua enciclopedia nell’era dei chatbot generativi.

La Wikimedia Foundation, che gestisce il progetto, ha infatti invitato le aziende di intelligenza artificiale a smettere di prelevare i suoi contenuti attraverso lo scraping e a utilizzare invece la piattaforma a pagamento Wikimedia Enterprise, pensata proprio per un accesso strutturato e sostenibile ai dati.

Col termine “scraping” si indica l’estrazione automatica di grandi quantità di testi o immagini da un sito web, spesso senza autorizzazione. È una pratica alla base dell’addestramento dei modelli fondazionali come ChatGPT o Gemini, che hanno bisogno di enormi quantità di informazioni per funzionare.

Il problema, secondo Wikipedia, è che questo processo grava sui suoi server e sfrutta il lavoro di milioni di volontari senza alcun ritorno economico o visibilità.

Il picco di traffico “fantasma”

Negli ultimi mesi la Wikimedia Foundation ha notato un’anomalia nel traffico verso il proprio sito. Dopo aver potenziato i sistemi di rilevamento, ha scoperto che l’impennata di visite registrata tra maggio e giugno era in realtà dovuta a bot di intelligenza artificiale che cercavano di “sfuggire al rilevamento” fingendosi utenti umani.

Parallelamente, le visualizzazioni reali, ovvero quelle generate dalle persone, sono calate dell’8% rispetto all’anno precedente.

Il post della Fondazione non minaccia sanzioni o azioni legali ma traccia una linea chiara. Le aziende di intelligenza artificiale devono utilizzare i contenuti “in modo responsabile”, con un’adeguata attribuzione e preferibilmente attraverso Wikimedia Enterprise.

L’obiettivo è duplice: evitare di sovraccaricare i server e permettere alle aziende di sostenere la missione no profit di Wikipedia, che vive di donazioni e lavoro volontario.

L’appello: dare credito al lavoro umano

“Affinché le persone possano fidarsi delle informazioni condivise su internet, le piattaforme dovrebbero rendere chiara la provenienza dei dati e offrire la possibilità di visitare e partecipare direttamente alle fonti”, si legge nel post ufficiale.

Per Wikipedia, il rischio non è solo economico ma anche culturale. Meno visite significano meno volontari pronti a migliorare le voci e meno donatori disposti a contribuire, in un circolo vizioso che potrebbe indebolire una delle ultime grandi opere collettive del web aperto.

La mossa di Wikipedia arriva in un momento di tensione crescente tra i produttori di contenuti e le aziende che sviluppano modelli generativi.

Da un lato, i colossi dell’IA dipendono da fonti aperte per addestrare i propri modelli. Dall’altro, sempre più editori hanno iniziato a chiedere compensi per l’uso del loro materiale.

Con la sua piattaforma a pagamento, Wikimedia cerca una via di mezzo: continuare a condividere conoscenza liberamente, ma in modo sostenibile e trasparente.

Fonte: TechCrunch

POTREBBE INTERESSARTI

Papa Leone XIV
• ⏱ 2 min

Magnifica Humanitas: il Papa pubblica la sua prima enciclica sull’IA insieme al co-fondatore di Anthropic

Papa Leone XIV presenterà la sua prima enciclica sull’IA; tra i relatori anche Christopher Olah, responsabile della ricerca sull’interpretabilità...
OpenAI Elon Musk
, • ⏱ 2 min

Musk perde contro OpenAI: accuse prescritte

Un tribunale federale USA archivia il caso dopo un mese di processo. Altman e OpenAI escono vincitori contro Musk, arrivato in ritardo con le accuse.

JPMorgan
• ⏱ 4 min

La causa JPMorgan e i video (falsi) che milioni hanno visto

Bastano pochi minuti e un chatbot per costruire una storia falsa su chiunque. Il caso della banca americana mostra come uno scandalo giudiziario possa diventare materia...
Eric Schmidt Google
• ⏱ 3 min

Eric Schmidt fischiato dai neolaureati: l’IA non entusiasma i giovani

L’ex CEO di Google e un’altra dirigente hanno provato a vendere l’IA come futuro luminoso a chi sta per entrare in un mercato del lavoro in crisi. Non...
Agenti IA
• ⏱ 3 min

Troppi agenti IA: le grandi aziende corrono ai ripari

Gartner stima 150.000 agenti per azienda Fortune 500 entro due anni. Solo il 13% delle organizzazioni si dice pronta a gestirli.

Elon Musk vs Sam Altman OpenAI
, • ⏱ 3 min

Musk in Cina, Altman in aula: il processo dell’anno ai titoli di coda

Altman accusato di mentire, Musk di amnesia selettiva: mentre la giudice prepara la sentenza finale, OpenAI difende il suo primato.

Jensen Huang Nvidia
, , • ⏱ 3 min

Trump porta Huang a Pechino: gli H200 sono approvati ma la Cina non li compra

Gli Stati Uniti hanno dato il via libera ma la Cina blocca i propri acquirenti. E nel mezzo c’è Nvidia, che ha visto la propria quota di mercato cinese...
Sundar Pichai. Foto: Sanjay Rawat
, , • ⏱ 3 min

Soci e rivali: Google e SpaceX trattano per i data center in orbita

Google è azionista di SpaceX da anni. Ora le due aziende potrebbero diventare partner sui lanci (e concorrenti nello spazio).

Trump USA Xi Jinping Cina
, , • ⏱ 4 min

Trump e Xi parlano di IA, ma il dialogo resta difficile

A Pechino l’intelligenza artificiale entra per la prima volta nell’agenda bilaterale USA-Cina. Le aspettative però sono basse: troppa rivalità, troppa...
sam altman reuters
, • ⏱ 4 min

Altman in aula: “Musk voleva il 90% di OpenAI”

Il CEO di OpenAI testimonia su donazioni, equity e metodi manageriali che “hanno devastato la cultura” del laboratorio.

Share This