Life in the data center: monitoraggio dell’ infrastruttura

Cosa succede in caso di guasto e quali sono i meccanismi di ripristino dei servizi?

Sistemista gazzellaOgni giorno, in Africa, una gazzella si sveglia e sa che dovrà correre più veloce del leone. Ogni giorno, un sistemista si sveglia e sa che anche lui… dovrà correre! Perché si sa: la vita nel datacenter non si ferma mai.

Tutti i nostri servizi e sistemi sono costantemente monitorati, i tecnici di turno tengono sotto stretta osservazione i grafici dei dati ambientali, del traffico di rete, lo stato dei server fisici e di tutti i servizi offerti. Il monitoraggio dei servizi avviene utilizzando il software Nagios, uno dei software leader del settore.

Quando si verifica un problema, Nagios invia una segnalazione ai tecnici addetti alle operation che immediatamente si allertano. E’ questo il momento di correre! Dopo aver ricevuto l’allarme i tecnici si coordinano per risolvere il problema e far rientrare immediatamente il guasto.

Correre si, ma con organizzazione. Il nostro obiettivo è quello di far rientrare i problemi nel minor tempo possibile e di essere sempre molto scrupolosi nella gestione del guasto, per non lasciare nulla al caso e per evitare che questo possa ripresentarsi.

All’interno del data center chi si occuperà effettivamente della risoluzione del problema e chi si terrà costantemente in contatto con i clienti per seguirli e per risolvere eventuali anomalie collegate. Sui guasti di una certa entità viene innescato un meccanismo di escalation, se infatti, il problema non è semplicemente risolvibile questo viene gestito da tecnici sempre più specializzati fino ad arrivare al resposabile del settore.

Oltre a monitorNagios seewebare lo stato di tutti i nostri server sia fisici che virtuali, con annessi tutti i servizi erogati, monitoriamo tutti i parametri infrastrutturali dei nostri datacenter: dalle varie temperature all’ energia elettrica, dai sistemi di raffreddamento allo stato delle connessione in fibra.

Non monitoriamo solamente la nostra infrastruttura, ma anche quella del cliente, in base alla tipologia di assistenza e alle specifiche del progetto; in questo modo, siamo pronti ad intervenire tempestivamente e il cliente può dedicarsi pienamente al suo lavoro senza preoccuparsi dei problemi sistemistici.

Riteniamo il sistema di monitoraggio un punto nevralgico della nostra azienda e solo lavorando in questa maniera, controllando cioè costantemente infrastruttura e servizi, ed agendo in modo veloce e pro-attivo, si riesce a fornire un servizio di alta qualità.

Un commento a Life in the data center: monitoraggio dell’ infrastruttura

  1. Michele Moro ha detto:

    Buongiorno,

    esiste un monitoraggio di tipo End to End sulle vostre applicazioni? Ad esempio, si riesce a simulare la registrazione al vostro portale e a monitorare i vari step creando un allert qualora uno di questi vada in errore? Oppure, è possibile monitorare tutto il processo di gestione e pagamento degli ordini simulando il comportamento dell’utente? Se si, come? Sfruttate il sistema Nagios?

    Grazie mille e buona lavoro.
    Michele

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

*

Accedi

Registrati | Password dimenticata?