Life in the data center: monitoraggio dell’ infrastruttura

Cosa succede in caso di guasto e quali sono i meccanismi di ripristino dei servizi?

Sistemista gazzellaOgni giorno, in Africa, una gazzella si sveglia e sa che dovrà correre più veloce del leone. Ogni giorno, un sistemista si sveglia e sa che anche lui… dovrà correre! Perché si sa: la vita nel datacenter non si ferma mai.

Tutti i nostri servizi e sistemi sono costantemente monitorati, i tecnici di turno tengono sotto stretta osservazione i grafici dei dati ambientali, del traffico di rete, lo stato dei server fisici e di tutti i servizi offerti. Il monitoraggio dei servizi avviene utilizzando il software Nagios, uno dei software leader del settore.

Quando si verifica un problema, Nagios invia una segnalazione ai tecnici addetti alle operation che immediatamente si allertano. E’ questo il momento di correre! Dopo aver ricevuto l’allarme i tecnici si coordinano per risolvere il problema e far rientrare immediatamente il guasto.

Correre si, ma con organizzazione. Il nostro obiettivo è quello di far rientrare i problemi nel minor tempo possibile e di essere sempre molto scrupolosi nella gestione del guasto, per non lasciare nulla al caso e per evitare che questo possa ripresentarsi.

Accedi

Registrati | Password dimenticata?