Il chiodo fisso della resilienza informatica
Gentile cliente,
oggi parliamo di due cose all’apparrenza poco inerenti tra loro, ma che in realtà sono strettamente collegate: il chiodo che ha paralizzato le ferrovie italiane (e l’Italia stessa) per diverse ore e la resilienza dei sistemi informatici.
Infatti, dietro a questo incidente, troviamo una grande lezione, che ogni azienda dovrebbe imparare.
Cos'è successo
In base a quanto è stato riportato dalla stampa, nella notte di mercoledì 2 ottobre, un operaio della ditta incaricata della manutenzione ha piantato un chiodo in una canalina in cui passavano i cavi elettrici che alimentano la sala operativa della stazione di Roma Termini.
Il guasto provocato dal chiodo ha lasciato la sala operativa senza elettricità, facendo scattare il gruppo di continuità, pensato per fornire energia alla sala in caso di emergenza e, di conseguenza, a mantenere operativo tutto il sistema ferroviario.
Nel frattempo, non è partita alcuna segnalazione di sistema e nessun operatore è intervenuto per risolvere il problema.
Alle 6:20 della mattina, le batterie del gruppo di continuità si sono scaricate e il traffico ferroviario è stato completamente bloccato, causando un grandissimo disagio ai viaggiatori ed ingenti danni (economici e reputazionali) agli operatori ferroviari.
La mancanza di ridondanza e di monitoraggio
Ma cosa c’entra questo incidente con la sicurezza informatica?
Un caso come questo è l’esempio perfetto di come NON dovrebbe venire gestita la resilienza di un sistema, dal momento che sono mancati 2 elementi chiave:
- Ridondanza
Quando parliamo di ridondanza, parliamo dell’aggiunta di ulteriori dispositivi, al fine di garantire la continuità in caso di problemi al sistema. Per esempio, se un sistema server necessita di 4 dischi, si aggiungeranno altri 2 dischi, così da assicurare un servizio continuo anche qualora dovessero esserci danni o problemi alle unità di base.
Nel caso di cui sopra, la sola presenza delle batterie del gruppo di continuità non era sufficiente a garantire la continuità operativa.
- Monitoraggio e collaudi
L’altro aspetto fondamentale di un approccio resiliente è il continuo monitoraggio e collaudo dei sistemi. Implementare sistemi di monitoraggio professionale e costante, e non solo affidarsi ad una semplice mail di segnalazione che rischia di non essere inviata, fa la differenza.
Testare gli scenari peggiori e verificare come si comportano i sistemi in queste situazioni permette di assicurarsi che non ci siano problemi nel processo di continuità.
Con i dovuti controlli, il personale si sarebbe accorto che il sistema di allerta del gruppo di continuità aveva dei problemi: questo avrebbe evitato il mancato allarme e il conseguente esaurimento delle batterie.
La mancanza di ridondanza e di monitoraggio
Come abbiamo visto, un approccio resiliente alla sicurezza informatica è fondamentale per prevenire interruzioni di servizio e danni all’azienda.
Ma non solo, dal 1° ottobre 2024, esso è diventato obbligatorio per legge, dopo l’accoglimento della normativa italiana della direttiva NIS 2 (della quale abbiamo parlato in una newsletter precedente).
Info.tec è al tuo fianco in ogni momento
La resilienza si costruisce in 2 momenti: nella preparazione di un progetto e nel suo monitoraggio dei sistemi quando sono in funzione.
Info.tec può assistere al meglio la tua azienda in entrambe queste fasi, definendo un sistema di ridondanza ad hoc e monitorando costantemente il corretto funzionamento dei sistemi informatici, effettuando test e simulazioni dei vari scenari.
Contattaci e insieme scopriremo come possiamo aiutarti a rendere la tua azienda sicura e conforme.