Ieri, Microsoft ha affrontato un nuovo blackout dei suoi servizi cloud, che ha lasciato fuori uso le email e Microsoft Teams, causando notevoli disagi agli utenti. Questa volta, l’interruzione non era collegata all’incidente di CrowdStrike, ma è stata causata da problemi interni ai server Azure. L’interruzione ha avuto effetti a cascata, colpendo i servizi di posta elettronica, Microsoft 365 e Xbox Live. Fortunatamente, il problema è stato risolto dopo circa quattro ore.
Oltre a questi servizi principali, anche altre piattaforme Microsoft sono state colpite. Intune, che gestisce le risorse aziendali, ed Entra, un servizio basato sul cloud per l’autenticazione e l’autorizzazione, hanno subito disservizi. La Power Platform, che consente alle imprese di creare applicazioni, analizzare dati e automatizzare flussi di lavoro, è stata anch’essa coinvolta. Questo includeva anche GitHub, la più popolare piattaforma per sviluppatori, e Microsoft Teams, utilizzato globalmente per organizzare il lavoro e fare videochiamate.
DownDetector ha ricevuto centinaia di segnalazioni da parte degli utenti fin dal primo pomeriggio, con molti che lamentavano l’impossibilità di accedere alle email e di ricevere inviti. I problemi si sono estesi anche ai gamer, con utenti di Xbox e Minecraft che hanno avuto difficoltà di accesso. Microsoft non ha ancora rilasciato una comunicazione ufficiale sulla causa dell’interruzione.
Questa interruzione dei servizi arriva a meno di due settimane da un crash precedente che ha coinvolto migliaia di aziende e milioni di utenti in tutto il mondo, causato da un problema con CrowdStrike. Questo incidente ha provocato perdite economiche globali stimate in circa 5,4 miliardi di dollari.
Microsoft, nel frattempo, dopo aver comunicato la stima degli 8,5 milioni di dispositivi interessati dal tilt informatico, ha pubblicato un’analisi tecnica dettagliata di questo incidente contenente dati di telemetria e alcune spiegazioni che hanno causato l’arresto anomalo dei sistemi Windows.
L’azienda ha spiegato che il bug è stato causato da un problema nel file CSagent.sys sviluppato da CrowdStrike. Questo file ha provocato un errore di sicurezza della memoria, cercando di accedere a una zona non assegnata al processo specifico. Quando il sistema ha rilevato che un file insolito tentava di leggere porzioni di memoria non autorizzate, Windows si è bloccato, mostrando la classica schermata blu.
L’azienda ha evidenziato che questo tipo di accesso errato alla memoria è raro, ma può essere molto pericoloso per l’integrità del sistema. Microsoft ha inoltre sollevato la questione del kernel, il programma che, inserito nel sistema operativo, ha il controllo completo della macchina e monitora i processi per garantire un accesso sicuro. La possibilità per fornitori terzi, come CrowdStrike, di accedere al kernel aumenta i rischi di sicurezza, come dimostrato dall’incidente del 19 luglio scorso.
Per prevenire tali problemi in futuro, Microsoft ha pianificato di rafforzare la sicurezza dei propri prodotti attraverso l’implementazione di linee guida rigorose per gli aggiornamenti, la riduzione dei driver del kernel necessari e la massimizzazione dell’isolamento e della protezione da manomissioni. Inoltre, adotteranno un approccio Zero Trust, che prevede la verifica e l’autorizzazione esplicita di ogni richiesta di accesso a risorse o servizi, indipendentemente dalla sua origine, prima di concederla.