La diagnosi prima del recupero dati raid

La pre diagnosi di un caso di recupero dati da raid inizia con una breve intervista al cliente.

La prima cosa da capire è se il RAID era monitorato, cioè se erano attivi sistemi di allerta via mail, file di log, monitoraggi periodici quotidiani settimanali fatti dal personale del sito.

Nella maggior parte dei casi, infatti, quando un RAID giunge presso i nostri laboratori il problema è semplicemente dovuto al malfunzionamento di un disco, ma sono più unità a presentare valori SMART errati o a essere guasti.

Se si tratta di un RAID 5 o superiore con più di un disco con errori o malfunzionanti, è fondamentale individuare con precisione quale disco è fallito per primo in ordine di tempo per poter procedere con il recupero dei dati.

I sistemi RAID 5, RAID 6 e le loro combinazioni con RAID 0, come RAID 50 e RAID 60, utilizzano un algoritmo per garantire la ridondanza delle scritture; se i dischi si guastano o vengono messi offline in momenti differenti, l'unità estromessa per prima viene definita disco "stale" (stantio) e risulta assolutamente inutile ai fini della ricostruzione del RAID, addirittura inserirlo nella ricostruzione produrrebbe file danneggiati. Eliminare l'incognita di un eventuale disco stantio è quindi indispensabile per la ricostruzione.

Altre incognite sono problematiche legate ai dischi "spare", ma queste sono meno frequenti e generalmente la loro presenza e la loro posizione sono note al cliente.

Un'altra informazione che talvolta può essere non così semplice da ottenere è il livello del RAID.

Ad esempio ci è capitato un caso dove, sia il cliente che l'assistenza tecnica ufficiale della casa produttrice, erano assolutamente convinti che il Raid fosse di tipo 6. Come spiegato nella pagina del Raid 6 la capacità utile in un raid di questo tipo è pari a quella del numero degli hard disk che lo compongono, meno 2.
Fortunatamente noi seguiamo manualmente e da vicino la procedura di recupero dei RAID e questo, al contrario di sistemi automatici, ci ha permesso di scoprire che il RAID non era di livello 6, bensì di livello 50. Grazie alla nostra analisi manuale low level siamo stati in grado di applicare la corretta procedura di ricostruzione risparmiando molto tempo e riuscendo a recuperare tutti i dati.

Stabilito il maggior numero di confini possibili dello scenario, si può passare alla fase fondamentale e più critica, ovvero la clonazione degli hard disk.