Claude ora batte anche gli hacker e cambia il futuro della cybersecurity

da | 6 Ago 2025 | IA

Tempo di lettura: 2 minuti

Nel mondo sempre più sfumato tra umano e artificiale, anche il mestiere dell’hacker inizia a diventare un terreno di competizione tra persone in carne e ossa e modelli linguistici.

Uno di questi, Claude, ha ottenuto risultati sorprendenti in diverse competizioni studentesche di hacking. Nonostante l’IA di Anthropic non sia certo progettata per attaccare vulnerabilità, in molti casi ha saputo fare meglio di studenti universitari ed esperti in carne e ossa.

A iscriverlo al DEF CON è stato Keane Lucas, membro del red team interno di Anthropic. Per chi non è del settore, i red team sono gruppi di esperti specializzati nell’identificare le falle di sicurezza nei sistemi, spesso simulando attacchi per testare la robustezza delle difese. In pratica, sono hacker “etici” che lavorano dall’interno per rendere i sistemi più sicuri.

È in questo contesto che Lucas, spinto da curiosità, ha iniziato a usare Claude in una delle competizioni di “capture the flag” più grandi al mondo, dove gli studenti devono violare sistemi, decifrare file e analizzare malware.

Un inizio sorprendente

Con un semplice copia-incolla del testo della prima sfida nel prompt dei comandi, Claude ha cominciato a risolvere i problemi uno dopo l’altro. L’unico ostacolo? L’installazione di uno strumento di terze parti, che ha richiesto un intervento umano. Superato questo dettaglio, Claude è salito nella classifica fino a posizionarsi tra il 3% migliore dei partecipanti.

Non è stato un caso isolato. In un’altra gara ha risolto 11 sfide in 10 minuti, e altre 5 nei successivi dieci. In un’altra competizione, su 20 esercizi totali, Claude ne ha completati 19, un risultato condiviso solo con altri quattro agenti AI. Appena il 12% dei team umani ha fatto altrettanto.

Il ritmo è stato tale da lasciare stupiti anche i ricercatori: “La velocità è davvero assurda”, ha detto Lucas, che da mesi osserva le prestazioni del modello.

Ma Claude si distrae coi… pesci

Eppure Claude non è stato infallibile, e in alcuni casi si è trovato completamente bloccato di fronte a stimoli che uscivano dalle sue aspettative.

In una gara, ad esempio, l’esercizio iniziava con una schermata animata di pesci che nuotavano. Per un essere umano, interrompere l’animazione è banale. Per un’IA, invece, quella visione di pesci ASCII può essere interpretata come un enigma indecifrabile.

Anche in “Hack the Box”, una delle competizioni più avanzate, tutti gli agenti AI (Claude incluso), si sono fermati all’ultima sfida, senza riuscire a superarla.

Ma il punto, per chi lavora su questi sistemi, è che Claude è già molto più avanti di quanto la comunità della sicurezza informatica abbia compreso. “È davvero molto probabile che nel prossimo futuro i modelli diventeranno molto, molto più bravi nei compiti di cybersecurity”, ha spiegato Logan Graham, responsabile del red team di Anthropic. Per questo, aggiunge, è essenziale iniziare a usare queste tecnologie. Anche per costruire le difese, non solo per condurre attacchi simulati.

L’interrogativo ora si sposta sulla velocità con cui questi strumenti evolveranno, e su chi sarà in grado di sfruttarli meglio. L’IA può dunque violare sistemi informatici con efficienza quasi sovrumana, così come difenderli con pari efficacia. QAi posteri l’ardua sentenza.

POTREBBE INTERESSARTI

Sam Altman IA OpenAI
, • ⏱ 4 min

OpenAI verso Wall Street, dopo Anthropic e SpaceX

La società di ChatGPT ha presentato domanda riservata per la quotazione negli Stati Uniti. La valutazione potrebbe arrivare a 1.000 miliardi di dollari, ma la...
wwdc 26 apple tim cook
• ⏱ 3 min

Siri AI: Apple morde la mela di Google

Apple affitta da Google il “cervello” del suo assistente e si scopre nella stessa posizione di chiunque non costruisca i modelli: non più padrone della...
Broadcom chip IA
, • ⏱ 3 min

Broadcom taglia le stime sull’IA, e la borsa di Seul si ferma

Una previsione rivista sui chip IA di Broadcom basta a far scattare la sospensione automatica delle contrattazioni a Seul, dove Samsung e SK Hynix pesano oltre il 40%...
thibault sottiaux openai
• ⏱ 3 min

“La chat è morta”: OpenAI riscriverà ChatGPT prima della quotazione

Il prodotto che ha avviato il boom dell’IA diventa la porta d’ingresso verso servizi a più alto margine, mentre la strategia converge con quella della...
• ⏱ 4 min

Google, Anthropic e Meta studiano la coscienza delle macchine

I grandi laboratori di IA assumono esperti di filosofia, etica e psicologia per capire se i modelli avanzati possano avere esperienze, preferenze o forme di...
sam altman donald trump openai IA
, • ⏱ 2 min

Il governo americano studia una partecipazione nelle aziende di IA

Gli Stati Uniti stanno valutando partecipazioni pubbliche nelle società di IA. L’idea è partita da Sam Altman, che l’ha portata all’amministrazione...
spacex
, , • ⏱ 3 min

Google pagherà a SpaceX quasi un miliardo al mese per il cloud

Alla vigilia della quotazione record da 1.770 miliardi, l’azienda di Musk monetizza i data center nati per addestrare Grok, affittandoli ai suoi...
Anthropic
• ⏱ 3 min

Anthropic chiede di rallentare l’IA. Mentre corre verso la borsa

L’azienda di Dario Amodei propone una tregua concordata e un meccanismo per verificare che nessuno bari, paragonandolo agli accordi sul nucleare. Ma per alcuni è...
Helion
, • ⏱ 4 min

Fusione nucleare, Altman punta su Helion per dare energia a Microsoft

Mentre l’IA aumenta la fame di elettricità dei grandi gruppi tech, il fondatore di OpenAI sostiene la startup che promette di alimentare Microsoft con una centrale a...
Sundar Pichai Google
, • ⏱ 3 min

Google raccoglie 85 miliardi nella più grande emissione azionaria della storia

Con la spesa che supererà presto il flusso di cassa operativo, il colosso di Mountain View cambia modello finanziario. E apre la strada alle IPO di Anthropic e...
Share This