MalTerminal è il primo malware noto a integrare GPT per generare codice malevolo durante l’esecuzione. Analisi e rischi di sicurezza.
Per anni abbiamo considerato il malware in maniera piuttosto semplice. Il codice malevolo era contenuto nel file con cui arrivava. Nonostante fosse nascosto, offuscato, o cifrato era comunque presente e rilevabile. Gli antivirus lo cercavano, lo analizzavano e, quando possibile, lo bloccavano. Tuttavia, questo pattern è destinato a cambiare in maniera definitiva, con l’arrivo di MalTerminal.

Il programma non contiene necessariamente il malware che andrà a eseguire. Lo chiede a un modello GPT nel momento in cui serve, generando il codice necessario direttamente durante l’esecuzione. Questo dettaglio ha attirato l’attenzione degli esperti di sicurezza informatica, che hanno analizzato il campione e pubblicato i risultati della loro indagine. Sebbene non sia ancora una nuova ondata di attacchi, è la dimostrazione che qualcuno ha già iniziato a sperimentare l’integrazione tra malware e modelli linguistici.
Ma come sempre, andiamo con ordine e affrontiamo per gradi l’argomento.
Che cos’è MalTerminal
MalTerminal è il nome di un insieme di campioni malevoli, scoperti per la prima volta il 19 settembre 2025 dal team di SentinelLabs. A individuarli sono stati Alex Delamotte, Vitaly Kamluk e Gabriel Bernadett-Shapiro, che hanno analizzato un piccolo cluster di file sospetti collegati tra loro. Tra questi era presente un eseguibile Windows chiamato MalTerminal.exe e una serie di script Python utilizzati per testare le stesse funzioni.
Il comportamento del programma è piuttosto diretto: mostra un menu all’operatore, chiede quale tipo di payload generare e poi interroga GPT-4 tramite API per ottenere il codice necessario. In pratica, il malware non contiene necessariamente il codice malevolo che verrà eseguito sulla macchina bersaglio. Quella parte viene richiesta al modello linguistico nel momento in cui serve, e generata direttamente durante l’esecuzione. Il codice utilizza un endpoint OpenAI che è stato dismesso all’inizio di novembre 2023, il che suggerisce che il progetto possa essere stato sviluppato prima di quella data. MalTerminal è quindi uno dei primi esempi documentati di malware progettato per interagire direttamente con un modello linguistico.
I ricercatori non hanno attribuito il tool a un autore specifico. L’ipotesi più attendibile è che si tratti di un Proof of Concept (PoC) sviluppato da un ricercatore di sicurezza, oppure di uno strumento sperimentale utilizzato in contesti di ricerca o red teaming.
Come funziona il malware con GPT integrato
L’analisi dei file collegati a MalTerminal mostra una struttura piuttosto semplice. Il programma si comporta come un’interfaccia a riga di comando che permette all’operatore di scegliere quale tipo di codice generare. Una volta selezionata l’opzione desiderata, il tool prepara un prompt e lo invia a un modello GPT tramite API. Il modello restituisce il codice richiesto, generalmente sotto forma di script Python. A quel punto il programma può salvarlo su disco oppure eseguirlo direttamente sul sistema. In questo modo la parte realmente malevola non è necessariamente presente nel campione originale, ma prodotta al momento, sulla base della richiesta inviata al modello.
Nel materiale analizzato dai ricercatori comparivano anche altri file che svolgevano la stessa funzione. Alcuni script Python riproducevano lo stesso meccanismo dell’eseguibile principale, permettendo di testare la generazione di payload diversi. Questo suggerisce che MalTerminal non sia un singolo programma isolato, ma piuttosto un piccolo progetto sperimentale costruito per esplorare l’uso dei modelli linguistici nella creazione di codice offensivo. Un altro elemento interessante riguarda la presenza di prompt e chiavi API direttamente all’interno dei file. In altre parole, il malware non si limita a usare un modello linguistico: incorpora anche le istruzioni necessarie per guidarne le risposte.
Il risultato finale è un tipo di strumento che funziona più come un generatore di payload che come un malware tradizionale. Il programma prepara la richiesta, il modello produce il codice e l’operatore decide come utilizzarlo. È una logica diversa da quella dei campioni classici, in cui tutto il comportamento malevolo è già definito all’interno del file.
I rischi dei malware basati su LLM
Essendo il primo caso del genere, i rischi per i malware basati su LLM sono diversi. Il primo di questi riguarda il modo in cui questi strumenti cambiano la struttura stessa del malware. Nei modelli tradizionali il codice malevolo è contenuto nel campione: può essere offuscato o cifrato, ma alla fine è sempre lì. Nel caso di strumenti come MalTerminal, invece, una parte del codice viene generata solo nel momento in cui il programma viene eseguito. Questo complica il lavoro di chi analizza i file sospetti. Un campione può apparire relativamente innocuo fino a quando non contatta un modello esterno e riceve il codice che dovrà eseguire. La logica offensiva non è quindi sempre visibile durante l’analisi iniziale del file.
A ciò si aggiunge l’utilizzo di API legittime. Se un malware interroga un servizio IA pubblico, il traffico generato può somigliare a quello di un’applicazione normale che utilizza lo stesso provider. Questo rende più difficile distinguere tra uso legittimo e comportamento sospetto, soprattutto nelle infrastrutture che già integrano servizi basati su modelli linguistici.
In più, l’impiego di un LLM può rendere il malware più flessibile. Se il codice offensivo viene prodotto su richiesta, lo stesso strumento può generare varianti diverse senza dover essere riscritto ogni volta. Non significa che il malware diventi automaticamente più sofisticato, ma introduce un elemento di adattabilità che fino a pochi anni fa era molto più difficile da implementare.
Tuttavia, ricordiamo che i malware che integrano modelli linguistici sono ancora in una fase sperimentale. Proprio per questo tendono a lasciare tracce abbastanza evidenti, come prompt incorporati nel codice o chiavi API esposte, elementi che possono diventare punti di partenza utili per le attività di analisi e di threat hunting.
Come difendersi da MalTerminal
I malware che integrano modelli linguistici non richiedono difese completamente nuove, ma rendono più importante il controllo di alcuni comportamenti specifici. Di seguito sono riportati i più importanti.
- Monitorare le connessioni verso API di modelli linguistici.
Host che normalmente non utilizzano servizi AI ma iniziano a contattare endpoint di provider LLM possono indicare attività anomale. - Controllare la presenza di chiavi API incorporate nel codice.
Script o binari che contengono chiavi API e prompt strutturati possono rivelare strumenti progettati per interrogare modelli linguistici esterni. - Analizzare processi che generano codice runtime.
Programmi che creano ed eseguono script durante l’esecuzione meritano particolare attenzione, soprattutto se il codice viene recuperato da servizi esterni. - Limitare l’accesso ai servizi IA ai soli sistemi autorizzati.
Definire quali host possono utilizzare API di modelli linguistici riduce il rischio che strumenti malevoli possano sfruttare questi servizi senza essere notati. - Integrare queste verifiche nelle attività di threat hunting.
La ricerca di prompt incorporati, chiavi API o chiamate sospette a servizi LLM può aiutare a individuare rapidamente strumenti simili a MalTerminal.
In conclusione
MalTerminal non è interessante per la complessità del codice, ma per ciò che dimostra. L’idea di collegare uno strumento offensivo a un modello linguistico esterno è la dimostrazione che qualcuno ha già iniziato a sperimentare. È un primo passo sufficiente a dimostrare che l’intelligenza artificiale può diventare parte dell’infrastruttura operativa di un attacco.
Ma attenzione: questo non significa che il cybercrime sarà rivoluzionato dall’oggi al domani. Attualmente, è ancora un esperimento e non esiste la dimostrazione di un suo utilizzo su larga scala. La storia della sicurezza informatica ci insegna che molte tecniche oggi diffuse sono nate proprio da progetti inizialmente marginali. Ecco perché MalTerminal merita la nostra attenzione, perché ci aiuta a capire in quale direzione si stanno muovendo gli strumenti offensivi.
