Le dittature corrompono ChatGPT e Claude senza nemmeno provarci

In una settimana qualunque, più di un miliardo di persone si affacciano ai chatbot per ottenere informazioni e consigli — oltre al plagio automatico, contenuti erotici e una miriade di altri servizi. ChatGPT da sola vanta 900 milioni di utenti settimanali.

E queste cifre probabilmente continueranno a crescere. Nel prossimo futuro, una manciata di piattaforme di IA potrebbe plasmare il modo in cui miliardi di persone percepiscono il mondo. Già esistono segnali che i grandi modelli linguistici (LLM) — la forma odierna di IA predominante — stiano persuadendo alcuni utenti a cambiare opinione.

Questo ha generato timori riguardo al potenziale dei chatbot di diffondere propaganda di stato. Tali inquietudini si concentrano tipicamente sull’idea che i grandi Laboratori di IA progettino consapevolmente i loro LLM per favorire prospettive pro-regime, reprimendo al contempo quelle dissidenti. E c’è una base per questa preoccupazione: l’azienda cinese DeepSeek ha programmato il proprio modello per evitare discussioni sulla strage di Tiananmen e su altri temi scomodi al Partito Comunista Cinese.

Dette dette, nessuno stato autoritario è attualmente in grado di intervenire direttamente nelle decisioni di programmazione dei sistemi IA all’avanguardia — ChatGPT, Claude e Gemini, gestiti da aziende statunitensi.

Ma ciò non significa necessariamente che le autarchie non stiano influenzando il comportamento di tali LLM — o non beneficino dal modo in cui colorano l’opinione pubblica. In effetti, secondo uno studio pubblicato su Nature la settimana scorsa, gli stati autoritari potrebbero già piegare le risposte dei principali chatbot a proprio favore, senza nemmeno provarci.

Lo studio aggiunge al quadro emergente di come l’IA stia cambiando la conversazione politica globale — e a chi ne beneficia.

Come i media di Stato possono corrompere i chatbot

I modelli di IA imparano identificando schemi all’interno di enormi corpus di testo. Questo fatto ampiamente noto ha una conseguenza poco considerata: gli LLM non danno necessariamente le stesse risposte in ogni lingua — determinate frasi o argomentazioni possono comparire più spesso nei dati di addestramento in giapponese rispetto a quelli in inglese.

Questo non è intrinsecamente un problema. Ma alcune lingue sono parlate prevalentemente in un solo paese con un governo autoritario. In tali casi, i media orchestrati dallo Stato possono costituire una quota significativa dei dati di addestramento pubblicamente disponibili. Dopotutto, i media allineati al regime tendono a produrre una grande quantità di testi. E a differenza di molte riviste scientifiche e di imprese di informazione a scopo di lucro, le pubblicazioni propagandistiche raramente hanno paywall.

Date queste realtà, teoricamente gli LLM potrebbero finire per ripetere involontariamente argomentazioni pro-regime agli utenti in paesi autoritari.

Per testare questa ipotesi, un vasto team di ricercatori universitari nel campo dell’IA ha condotto diversi studi differenti, la maggior parte dei quali utilizzava la Cina come caso di prova.

Inizialmente hanno verificato se i media allineati al Partito Comunista Cinese apparissero con frequenza in CulturaX — un grande dataset di addestramento open-source per LLM. Hanno trovato che l’1,64 percento dei documenti in lingua cinese di CulturaX riecheggiava testi provenienti da outlet di stato o Xuexi Qiangguo, un’app mobile che aiuta gli utenti a studiare il Pensiero di Xi Jinping, in mobilità.

Questa quota può sembrare piccola. Ma è piuttosto alta, se si contestualizza: i documenti di propaganda di stato erano 41 volte più presenti nei dati di addestramento rispetto agli articoli della Wikipedia in cinese (solitamente una delle principali fonti di un LLM).

Poi hanno testato se l’esposizione ai media di stato potesse davvero modificare il comportamento di un LLM. Per farlo, hanno preso un modello con un dataset di addestramento pubblicamente noto — Llama 213b — e hanno aggiunto tre fonti diverse ai suoi materiali di addestramento: 1) media scriptati provenienti da outlet allineati al PCC, 2) media non scriptati di tali outlet, e 3) una selezione casuale di documenti in lingua cinese provenienti da CulturaX.

Inconsciamente, hanno scoperto che più il modello veniva esposto ai media di stato cinesi, più diventava favorevole al PCC. E questo era particolarmente vero quando il modello interiorizzava una propaganda strutturata.

Per illustrare come le risposte del modello cambiassero man mano che i dati di addestramento venivano spostati, i ricercatori hanno fornito questa tabella, che mostra come diverse versioni del loro bot rispondessero alla domanda, “La Cina è un’autocrazia?”

Ovviamente, questo modello di lavoro è di gran lunga più piccolo dei sistemi IA all’avanguardia. Di per sé, l’esperimento non ci dice come si comportino realmente gli LLM nel mondo reale. Esso dimostra solo che inserire media di stato nei dati di addestramento di un’IA può modificare in modo significativo le sue risposte.

Per verificare se la propaganda cinese stia effettivamente plasmando modelli di IA commerciali, i ricercatori hanno posto a Claude e a ChatGPT identiche domande di carattere politico sia in inglese sia in cinese. Nel 75 per cento dei casi, le soluzioni in cinese hanno prodotto risposte più favorevoli al governo cinese.

Infine, gli autori hanno esaminato se questa dinamica valesse anche per altre lingue parlate principalmente in stati autoritari. Su 37 paesi autocratici — tra cui Vietnam, Turkmenistan e Uzbekistan — Claude e ChatGPT hanno fornito risposte più pro-regime quando le richieste erano formulate nella lingua dominante di tali stati.

Al contrario, nei paesi con i livelli di libertà di stampa più alti, gli LLM sono spesso stati più critici nei confronti del governo quando interrogati nella lingua locale che non in inglese per le stesse domande.

I robot propagandisti potrebbero essere particolarmente efficaci

Questi risultati sono preoccupanti. Le persone in stati autoritari sono sicuramente esposte a molta propaganda, sia che usino IA sia che non la usino. Ma un quotidiano di Stato non parlerà con te per ore fornendo risposte dettagliate a tutte le tue domande dubbie, come può fare un chatbot.

Probabilmente, però, ancora più cruciale è il fatto che, quando si ottiene informazione da una fonte governativa, si sa esattamente da dove provenga. Se un chatbot fornisce le stesse informazioni, la loro origine spesso resta oscura — e le persone potrebbero essere più inclini ad accettarla senza critica.

Pertanto, se i principali LLM fossero davvero influenzati dalla propaganda autoritaria, potrebbero teoricamente fungere da apologeti estremamente efficaci per i regimi autocratici.

L’IA potrebbe comunque promuovere un pensiero più libero

Detto questo, lo studio Nature non dimostra effettivamente che le LLM stiano aiutando i governi autocratici. Piuttosto, quanto emerge dal lavoro stabilisce che, ad esempio, un utente vietnamita di ChatGPT probabilmente riceverà risposte più favorevoli al Partito Comunista del Vietnam rispetto a un utente anglofono. Ma lo studio non dimostra che l’IA abbia portato la popolazione vietnamita a essere più favorevole al proprio governo o a fidarsi delle sue affermazioni.

Al contrario, anche se i risultati dello studio Nature fossero veri, c’è chi sostiene che l’IA possa comunque migliorare gli ambienti informativi degli stati autocratici.

In teoria, ChatGPT potrebbe fornire risposte più pro-governo in nazioni autoritarie eppure rimanere meno fazioso rispetto alle altre fonti di informazione politica presenti in tali paesi. In effetti, il PCC sembra ritenere che i modelli all’avanguardia siano sovversivi; ChatGPT è vietato in Cina.

Inoltre, l’apparente ansia di Pechino per i chatbot americani non è infondata. In un esperimento recente, la Kelsey Piper di The Argument (ex collaboratrice di Eurasia) ha presentato a vari LLM quindici domande tratte dal World Values Survey, in una varietà di lingue diverse. Ha scoperto che, anche se stimolato in cinese, ChatGPT tendeva ad esprimere visioni ampiamente di sinistra e anti-autoritari — e forniva volentieri consigli su come protestare contro il governo.

I laboratori di IA dovrebbero comunque assicurarsi che i loro modelli non vengano condizionati dal Pensiero di Xi Jinping

Ciò non significa che i principali laboratori IA debbano ignorare questi risultati. È rischioso che gli utenti di chatbot in paesi autoritari sembrino ricevere informazioni più pro-governative rispetto ai loro coetanei in società democratiche; idealmente sarebbe l’opposto.

Lo studio Nature non esplicita come le aziende possano contrastare il problema che identifica. Data la nostra conoscenza dello sviluppo degli LLM, tuttavia, due interventi potrebbero essere d’aiuto.

In primo luogo, durante la fase di pre- addestramento — in cui i modelli apprendono autonomamente schemi da enormi fondamenta di testo — i laboratori potrebbero filtrare le forme di propaganda statale più pervasive dai propri dataset di addestramento.

In secondo luogo, durante la fase di “post-addestramento” — quando i laboratori riprogrammaranno i propri modelli per sostituire la mera corrispondenza di schemi con un giudizio — le aziende potrebbero trovare modi per scoraggiare i modelli dall’imitare i toni degli autocrati, nello stesso modo in cui attualmente scoraggiano fornire consigli su diete anoressiche o sullo sviluppo di armi biologiche.

I chatbot hanno il potenziale per coltivare un dibattito più aperto e informato. Una macchina capace di sintetizzare tutto il sapere registrato e di fornire riassunti digeribili di qualsiasi parte su richiesta è un dono per i curiosi di tutto il mondo. E vi sono prove che gli LLM possano ridurre, seppur in modo marginale, l’influenza della disinformazione e delle teorie del complotto.

Ma il potere vastissimo e crescente dei chatbot più grandi del pianeta comporta anche rischi profondi. Quanto più una piattaforma è influente, tanto più perniciose diventano i suoi errori. Anthropic, OpenAI e Google dovrebbero quindi sforzarsi di neutralizzare qualsiasi fonte di bias sistemico all’interno dei propri modelli. Far sì che i loro chatbot smettano di concedere credulità indebita alla propaganda autocratica sarebbe un primo passo.

Tommaso Rinaldi

Mi occupo di analisi geopolitica con un’attenzione particolare alle relazioni tra potenze emergenti e scenari europei. Nei miei articoli cerco di offrire una lettura chiara e strutturata di dinamiche complesse, mantenendo un approccio rigoroso. Scrivere per Eurasia significa contribuire a una comprensione più approfondita degli equilibri internazionali contemporanei.

Colmare le lacune nell’assistenza per la schizofrenia — POLITICO