Come funziona la censura di YouTube sul coronavirus?

25 March 2020 – 16:46

(foto: Olly Curtis/Future Publishing via Getty Images)Dai video motivazionali agli sticker “Io resto a casa” su Instagram, anche i social network fanno la loro parte nel confortare le persone in questa fase di emergenza legata al coronavirus, incoraggiandole a rispettare le limitazioni agli spostamenti. Tuttavia, nessun controllo viene operato sui contenuti che vengono mostrati né tanto meno su quelli che invece sono stati rimossi, in virtù dell’auto-attribuita autorità delle piattaforme di decidere cosa sia una bufala o meno.

È dalle campagne contro il linguaggio d’odio e la propaganda estremista che i colossi tecnologici rivendicano piena autonomia nella gestione di contenuti non graditi sui loro canali, attuando una strategia ancora più utile oggi, che è imperativo evitare che false teorie e complotti mettano in crisi il precario autocontenimento al quale siamo chiamati a partecipare. Ma quanto invasivo e arbitrario sia questo intervento non è dato saperlo, o quasi. A cercare una risposta ci pensa il progetto internazionale di ricerca YouTube Tracking Exposed, che punta a misurare, grazie alla collaborazione di utenti in tutto il mondo, il livello di personalizzazione dei contenuti per ciascun utente.

L’iniziativa si basa sulla partecipazione volontaria degli utenti e inizia con l’installazione di un’estensione disponibile per Firefox, Google Chrome o Brave. Seguendo le istruzioni, viene richiesto ai volontari di accedere a YouTube e di visualizzare in totale cinque video per altrettante lingue (cinese, spagnolo, inglese, portoghese, arabo). Per ciascuna pagina l’utente non deve far altro che scorrere la schermata verso il basso, attendere dieci secondi e poi passare al video successivo.

“Questo ci permette di misurare quali contenuti vengono mostrati in base alla lingua”, spiega a Wired il coordinatore del progetto e studioso dei pregiudizi algoritmici, Claudio Agosti, “così da documentare se e in quale misura avviene una personalizzazione anche su un tema così di pubblico interesse”.

“Dalle informazioni fornite da YouTube e da altre piattaforme noi sappiamo soltanto quanti contenuti dichiarano di aver rimosso o promosso, sulla base di una valutazione ibrida che avviene sia tramite l’automazione degli algoritmi che grazie a un intervento umano”, precisa Agosti: “Ma i dati sono aggregati e non ci permettono di sapere cosa è stato rimosso oppure se l’automazione sia efficace per tutte le lingue quanto lo è per l’inglese”.

Di fatto il problema evidenziato è quello dei pregiudizi intrinsechi nel funzionamento di ciascun algoritmo, che viene inevitabilmente condizionato dal contesto nel quale è creato: “Sappiamo che queste soluzioni funzionano meglio soprattutto per l’inglese, lingua che beneficia di una più ampia diffusione e della massima condivisione anche tra gli stessi sviluppatori, ma non sappiamo di quanto ed è per questo che rivolgiamo alla collaborazione dei volontari, affinché ci aiutino a misurare e analizzare il fenomeno anche da un punto di vista indipendente”.

Nessun rischio per la privacy dei volontari

Pensato e ingegnerizzato da programmatori e attivisti dei diritti digitali, YouTube Tracking Exposed garantisce che nessun dato acquisito sarà riconducibile all’utente-volontario che lo ha generato. Per farlo, l’estensione genera una coppia di chiavi crittografiche che garantisce l’impossibilità per chiunque – salvo l’utente stesso – di accedere al cruscotto dove sono mostrati i dati individuali. Al team che conduce la ricerca – così come alle istituzioni accademiche che beneficeranno di più di questo progetto – rimarranno soltanto dati aggregati e anonimi (che comunque saranno disponibili pubblicamente per tutti), necessari per misurare in modo scientifico l’intervento di YouTube sull’esperienza degli utenti.

We talked to @wphillips49, @BostonJoan, and @EthanZ about how companies like Facebook, Reddit, and YouTube are handling misinformation about coronavirus––and what their responsibilities are in the midst of a public health crisis https://t.co/TX9pE6m2Kp — april glaser (@aprilaser) March 25, 2020

Anche se l’iniziativa è già a uno stadio avanzato, i dati verranno raccolti ancora per tutto il 25 e 26 marzo prima di essere rilasciati pubblicamente. In una fase successiva, il patrimonio di informazioni aggregate potrà essere elaborato per ulteriori studi: “Per noi è importante che partecipino quante più persone possibili, così da garantire una varietà del campione che analizzeremo. Speriamo che chi viene a conoscenza di YouTube Tracking Exposed senta come noi il bisogno di maggiore trasparenza da parte dei colossi tecnologici, a oggi sostanzialmente incontrastati nella loro facoltà di giudicare cosa possiamo vedere o meno”.

