Anteprima di Claude Mythos di Anthropic: tutto quello che c’è da sapere sul nuovo modello di intelligenza artificiale

Quanto è potente l’IA? Abbastanza da indurre Anthropic, una delle principali aziende nel settore dell’IA, ad annunciare all’inizio di questo mese che il suo ultimo modello di IA, Claude Mythos Preview, sarebbe disponibile solo per un numero limitato di aziende a causa di problemi di sicurezza — almeno per ora.

Claude Mythos Preview è stato progettato per uso generale, dice Anthropic, ma durante i test l’azienda ha scoperto che era estremamente efficace nell’identificare vulnerabilità nei sistemi di sicurezza di ogni tipo di software, generando potenziali rischi di sicurezza di proporzioni enormi.

Finora, Anthropic sta condividendo il modello Mythos Preview con una manciata di grandi aziende tecnologiche e banche tramite un programma chiamato Project Glasswing, pensato per offrire loro l’opportunità di correggere eventuali vulnerabilità di sicurezza esistenti e anticipare i tentativi di hacking che il modello potrebbe identificare.

Per capire meglio cosa rappresenti Claude Mythos Preview e la potenziale minaccia che comporta per la sicurezza online, Today, Explained co-conduttore Sean Rameswaram ha parlato con Hayden Field, giornalista senior di IA presso The Verge.

Di seguito è riportato un estratto della loro conversazione, tagliato per lunghezza e chiarezza. Puoi ascoltare l’intero episodio ovunque si trovino i podcast — inclusi Apple Podcasts, Pandora e Spotify.

Mythos è [l’ultimo modello di IA di Anthropic] progettato per essere un modello di IA generale, come gli altri. Ma ciò che hanno realizzato lavorandoci è che possedeva competenze speciali che non si aspettavano. Era davvero bravo nella cyber-sicurezza. Rilevava vulnerabilità ad alto rischio in praticamente ogni sistema operativo.

Questo è piuttosto grave se lo usi come hacker. E avere un piano per un elenco di ogni grande lacuna, insicurezza e vulnerabilità su tutti questi sistemi davvero ad alto profilo significa avere una lista di tutto ciò che potresti fare per farli cadere o sfruttare i dati.

Hanno capito che sarebbe stato meglio non rilasciarlo al pubblico generale perché potrebbe finire nelle mani sbagliate. E invece hanno selezionato solo alcune organizzazioni responsabili di infrastrutture critiche a cui rilasciarlo, in modo da poter chiudere quelle lacune nei loro sistemi.

Avete sentito parlare di molte delle aziende che attualmente hanno e usano Claude Mythos: Nvidia, JP Morgan Chase, Google, e apparentemente una dozzina o più di altre che costruiscono o mantengono infrastrutture software critiche. Ma come funziona in pratica?

Poiché l’hanno costruito come modello generale, probabilmente funziona come qualsiasi altro modello nel senso che lo usi e lo stimoli a individuare tutte le vulnerabilità nel tuo sistema.

Potresti essere Google Chrome e cercare parti specifiche, di nicchia, del browser che pensi possano avere vulnerabilità. Fondamentalmente stai chiedendo al modello di segnalarti tutte queste lacune davvero importanti per te e la tua sicurezza, e poi prendi quelle segnalazioni e le sistemi tu stesso.

Un hacker lo userebbe in modo simile. Se finisse nelle mani sbagliate, direbbe: «Sì, dimmi tutte le vulnerabilità presenti qui.» E poi lo porterebbero fuori dalla piattaforma e lo userebbero per qualcosa di nefasto. Quindi, sostanzialmente, è una questione di chi sta chiedendo al sistema e quali sono le loro motivazioni.

È sufficiente dire: «Hey, Claude, dimmi come questo sistema bancario potrebbe essere vulnerabile.» E poi Claude ci riflette un attimo, e fornisce una serie di risposte.

E sappiamo che i Googles e i Nvidias del mondo stanno effettivamente usando questa tecnologia?

Sì. Parte della ragione per cui Anthropic ha rilasciato questa è che volevano che queste organizzazioni riferissero esattamente su come Mythos funzionava e cosa faceva per chiudere le vulnerabilità e le lacune nei loro sistemi. È una questione di condivisione delle informazioni.

Stanno permettendo a queste aziende di usarlo per verificare quanto bene riesce a chiudere tutte queste lacune di alto profilo, e poi devono riferire ad Anthropic sull’efficacia.

Come sceglie Anthropic con chi condividere questa tecnologia?

Gliel’ho effettivamente chiesto. In pratica cercano difensori cibernetici o aziende su cui dipende molta gente, e che in seguito rappresenterebbe un enorme problema se venissero hackerate in alcun modo, forma o maniera.

JP Morgan Chase è un grande esempio. Anthropic ha offerto questa tecnologia anche al governo.

I concorrenti di Anthropic hanno strumenti simili? Probabilmente stanno lavorando su strumenti simili?

OpenAI sembra lavorare su uno strumento simile. Lo stesso Anthropic ha detto che non ritiene che resteranno in testa a lungo su questo. Credono che laboratori in tutto il mondo potrebbero rilasciare questa tecnologia nei prossimi tre mesi, sei mesi, dodici mesi.

Sembra che, nel corso dei prossimi dodici mesi, questa cosa sarà disponibile sul mercato. Ed è per questo che hanno voluto rilasciare Mythos ora, in modo che aziende e banche possano anticipare tutti gli attacchi che potrebbero presentarsi, quando tipi simili di tecnologia verranno rilasciati al grande pubblico, forse tra mesi.

Se tutto questo è così pericoloso e ci sono così tanti rischi potenziali, qualcuno sta discutendo di non rilasciare strumenti come questo e di tenerli internamente?

È una domanda davvero importante. Sono felice che tu l’abbia posta, perché non basta che le persone si chiedano se un sistema di IA debba effettivamente essere rilasciato o utilizzato per certe cose. In questo momento vediamo molte integrazioni di tipo “una taglia unica per tutto”. E spesso l’IA non è la risposta per molte situazioni.

Tuttavia, le persone tendono ad essere d’accordo che è qualcosa di necessario in questo momento. L’IA è già là fuori ad aiutare gli attaccanti informatici a intensificare i loro attacchi. E abbiamo visto questa tendenza intensificarsi nell’ultimo anno. Le persone sembrano concordare sul fatto che sia necessario l’IA per combattere gli attacchi informatici guidati dall’IA, essenzialmente.

È un po’ come delle fortificazioni medievali: si aggiungono pietre e si alzano le mura della fortezza perché una guerra si profila. È questa la sensazione che ho quando parlo con questi esperti. Sanno che sta arrivando. È solo una questione di rafforzare ora le difese per essere al meglio preparati.

Tommaso Rinaldi

Mi occupo di analisi geopolitica con un’attenzione particolare alle relazioni tra potenze emergenti e scenari europei. Nei miei articoli cerco di offrire una lettura chiara e strutturata di dinamiche complesse, mantenendo un approccio rigoroso. Scrivere per Eurasia significa contribuire a una comprensione più approfondita degli equilibri internazionali contemporanei.

Troppe crisi per un solo vertice?

Centri di detenzione per migranti in Albania non violano la legge UE, secondo il principale consigliere della Corte di giustizia dell’UE