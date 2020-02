Se Wikipedia la scrivono i bot

Un robot (Arterra/Universal Images Group via Getty Images)Che la versione di Wikipedia con più voci al mondo sia quella in lingua inglese non dovrebbe stupire nessuno. Per la precisione, questa edizione ha da poco superato i sei milioni di articoli (nel complesso, solo 16 edizioni hanno più di un milione di voci). Più sorprendente è invece scoprire che al secondo posto si piazza – con 5,37 milioni di voci – la versione di Wikipedia scritta in cebuano, una lingua austronesiana parlata nelle Filippine da poco meno di 16 milioni di persone (su un totale di 100 milioni di abitanti).

Ancora più stupefacente è che questa enorme mole di articoli è curata da un totale di 6 amministratori e 14 utenti attivi. Per avere un termine di paragone, basti pensare che l’edizione italiana ha 108 amministratori e oltre 9mila utenti attivi che si occupano di circa un milione e mezzo di voci. Come fa un’edizione curata in totale da una ventina di persone a diventare la seconda con più voci al mondo? La risposta è tutta in un’unica parola: bot.

Secondo quanto riportato da Motherboard Usa, il 99,12% delle voci in lingua cebuana è stato infatti creato da un software automatico battezzato Lsjbot, creato dal fisico svedese Sverker Johansson. Voci nella maggior parte dei casi brevissime e che trattano principalmente di temi scientifici (i più semplici da scrivere per i bot grazie all’abbondanza di dati).

E quindi, i bot stanno conquistando Wikipedia e trasformando l’enciclopedia online più famosa del mondo nel loro campo da gioco personale? Le cose, per fortuna, non stanno così. “I bot che aiutano nella gestione di Wikipedia non sono certo una novità”, spiega Lorenzo Losa, presidente di Wikimedia Italia: “In generale, la loro funzione è di svolgere lavori di manutenzione e in cui l’intervento umano non ha un valore particolare. Per esempio, sono i bot che si occupano di correggere tutte le volte che sulla parola ‘perché’ viene messo l’accento grave invece che acuto. È una funzione che fa risparmiare parecchio lavoro agli utenti umani e contribuisce a migliorare l’enciclopedia. Altri bot si occupano invece di controllare quando i link esterni diventano irraggiungibili e li sostituiscono con i link conservati dall’Internet Archive”.

I bot al lavoro

Ci sono ovviamente molti altri compiti che sono svolti in maniera egregia dai bot: identificare i tentativi di vandalismo o di spam, archiviare i contenuti che per qualche ragione non sono più adatti, generare le liste di voci e, in alcuni casi, creare direttamente gli articoli. Una funzione utilizzata anche nell’edizione italiana. “Nel nostro caso, l’esempio più importante è quello dei comuni. Uno dei nostri obiettivi è infatti avere le voci di tutte le città e i paesi italiani. Fare in modo che sia un bot a creare le pagine, utilizzando le informazioni contenute sui database ufficiali, ci permette di avere a disposizione una struttura con cui poi gli utenti possono facilmente interagire per integrare le voci”, spiega Lorenzo Losa.

In poche parole, il compito del bot è dare vita alla pagina di un comune e fornire le informazioni di base (provincia, abitanti, regione, ecc.), impostandole tutte in maniera omogenea e creando anche la classica tabellina laterale. A quel punto, sono gli utenti attivi di Wikipedia che possono intervenire per arricchire il più possibile la voce. “Aggiungere o arricchire la sezione dedicata ai monumenti è molto più facile quando la pagina è già stata creata. Inoltre, in questo modo ci assicuriamo che tutte le voci siano tra loro più uniformi”, prosegue il presidente di Wikimedia Italia.

L’esempio dell’Italia

In questi casi, il compito dei bot è quindi quello di far nascere le voci, incentivando e semplificando il lavoro delle persone che poi interverranno per integrarle. Un lavoro che, in Italia, è stato svolto oltre che per i comuni anche per gli articoli relativi agli asteroidi, creati utilizzando un database ufficiale dal quale il bot ha potuto attingere tutte le informazioni necessarie. Un caso non relativo all’Italia è invece quello di Mbabel, un software creato nel 2018 e che contribuisce alla produzione di bozze di voci (che dovranno essere riviste da un editor prima della pubblicazione) relative ai musei di tutto il mondo, dettagliando le loro caratteristiche e soprattutto catalogando le opere d’arte lì ospitate (questa, per esempio, è la voce in portoghese relativa al Museo di San Paolo).

A questo scopo, Mbabel sfrutta anche Wikidata, il database che fornisce informazioni leggibili e utilizzabili dai software e che consente inoltre di aggiornare automaticamente tutte le voci che utilizzano le informazioni in esso contenute (questa, per esempio, è la voce relativa all’Everest). L’uso dei bot, quindi, non solo non è una novità, ma è anche qualcosa che alleggerisce il carico di lavoro degli editor e degli utenti di Wikipedia e che contribuisce a mantenerla aggiornata, ordinata e corretta.

Made by bot

La versione in lingua cebuana è un quindi un caso estremo. “Sono dell’idea che le edizioni si debbano sviluppare in maniera organica attorno a una comunità di contributori”, prosegue Lorenzo Losa: “I bot sono molto utili, ma nel momento in cui un’edizione è gestita quasi integralmente in maniera automatica è difficile che i contenuti al suo interno siano interessanti. Credo che forse sarebbe meglio accontentarsi di un’edizione più piccola e concentrarsi semmai sulla crescita della comunità. È però anche vero che, in mancanza di una comunità attiva, i bot danno la possibilità di avere contenuti in una lingua come il cebuano, che è comunque parlato da 15 milioni di persone e che magari è utilizzato in un’area in cui la diffusione di Wikipedia o di internet è molto inferiore”.

A scanso di equivoci, però, non sarebbe forse utile segnalare quando una voce è scritta da un bot? “È indicato nella cronologia delle modifiche, in cui si vede l’elenco degli utenti o dei bot che hanno contribuito. Segnalare esplicitamente che una voce è stata creata da un bot non è un problema che si pone, perché trovare una voce che non ha ricevuto interventi da parte di utenti umani è estremamente difficile. È ovvio che tutto dev’essere fatto con criterio e che di qualunque strumento si può abusare, ma l’utilizzo dei bot ha l’obiettivo di migliorare la qualità di Wikipedia”.

