Oltre alle traduzioni automatiche, al copyright e alle fake news, l’intelligenza artificiale può essere applicata con successo anche al riconoscimento del codice malevolo tramite l’analisi statica. Questo almeno è il progetto a cui lavorano Microsoft e Intel, con l’obiettivo dichiarato di rendere più pratica e veloce l’identificazione di nuove genìe di malware in un modo tecnologico che corre a velocità superluminari.
Il progetto del duo che una volta era noto come Wintel si chiama STAMINA, ovvero static malware-as-image network analysis, e prevede l’utilizzo degli algoritmi di deep learning (DL) per scovare il codice malevolo all’interno dei file eseguibili. Per raggiungere l’obiettivo, gli esemplari infetti vengono convertiti in immagini bidimensionali a scala di grigi, con dimensioni (altezza e larghezza) dipendenti dallo spazio occupato dal file e un valore di “intensità” per ogni pixel compreso tra 0 e 255.
Le immagini così composte (e ridimensionate) sono state date in pasto a una rete neurale DL già “addestrata” in precedenza, che ha classificare il sample come pulito oppure infetto. Su 2,2 milioni di file eseguibili (PE) usati nei test, le analisi di STAMINA hanno identificato con successo il 99,07% degli esemplari virali. La percentuale dei falsi positivi è stata pari al 2,58%.
Nelle speranze dei ricercatori di Microsoft e Intel, una tecnologia a base di IA come STAMINA potrebbe in futuro costituire una preziosa arma aggiuntiva nel contrasto al codice malevolo e alle minacce informatiche. Un’analisi statica tecnologicamente avanzata da usare assieme all’analisi dinamica e comportamentale per sviluppare sistemi di identificazione delle minacce ancora più potenti ed efficaci.