Recupero dati Raid 50

Come si recupera un RAID 50?

Prima di parlare del recupero dati da un RAID 50, è bene disquisire su quando e perché si renda necessaria o sia suggerita l'implementazione di un RAID di livello 5+0.

Un assunto con tanto di formula vorrebbe, e noi concordiamo, che un RAID di livello 5 o uno di livello 6, non vada ad essere messo in produzione di capacità totale superiore a 10 terabyte, di conseguenza la capacità dei singoli dischi non dovrebbe essere superiore a 2 terabyte.

Questa è la formula:

P=(1-URE)(8*(109)*N*S)

dove la P risultante è la probabilità in percentuale, che il rebuild in un dato sistema RAID fallisca, mentre URE è l'acronimo del parametro qualitativo Unrecoverable read errors per bits read (in alcune schede detto Non-recoverable read errors per bits read) che troviamo nelle caratteristiche tecniche degli HD; vediamo un esempio pratico di Non-recoverable read errors per bits read nella scheda tecnica dei WD RED che ATTENZIONE, è una sorpresa anche per noi, è 10-14.

Senza entrare nei dettagli di questa formula, si sappia che nei fattori c'è il numero dei dischi, la loro capacità, ed inoltre il fattore URE suddetto.

Sviluppando la formula con dati reali, per un RAID 5 realizzato con 6 HDD da 2TB, ne risulta una tabella come questa:

URE Probabilità di rebuild fallito
10-14 ~55%
10-15 ~10%
10-16 ~0%

Considerando che mediamente il parametro URE dei dischi più diffusi è 10 elevato alla meno 15a. si evince che anche 10% è sarebbe una percentuale molto alta, o perlomeno inaccettabile in ambiti critici.

Niente paura, il tutto rimane un calcolo empirico e piuttosto pessimistico, ma rende l'idea e ci da un idea dell'andamento dei rischi all'aumentare dei dischi e o della loro capacità.

ATTENZIONE: RIMANE VALIDO IL FATTO che l'utilizzo del RAID è ottimo. Perché è vero che con un rebuild fallito si bloccherà il RAID, ma almeno, grazie alla ridondanza del sistema multi disco, in un centro di recupero dati RAID come il nostro, i dati si recupereranno.

Il RAID 50 si implementa per buon compromesso spazio utile a disposizione in relazione al numero di dischi impiegati e il basso rischio di fallimento del rebuild.

Con questa architettura, si divide lo storage in blocchi RAID 5 di pochi dischi e poi con il meccanismo del RAID 0 li si va a "sommare" tra di loro da qui la dicitura RAID 50, che più propriamente sarebbe appunto RAID 5 + 0.

Le carte da mettere in ordine nella ricostruzione di un RAID 50 sono molto rimescolate: se nella pre diagnosi fatta col cliente o con i suoi consulenti IT, non è possibile avere un quadro preciso per quanto riguarda i dischi impiegati nei singoli blocchi RAID 5, il loro ordine, il loro stato, ecc., i calcoli che si dovranno fare risulteranno ben più complessi rispetto a quelli di un recupero dati di due RAID 5 singoli e non solo, sarà necessario compiere un ulteriore calcolo per il secondo stripe size utilizzato per le fette del RAID 0.

Una bella sfida insomma, che noi siamo abituati a vincere, grazie al fatto che i calcoli per riordinare i dischi dei RAID, per calcolare il loro stripe size, per calcolare la rotazione della parità, qui in Recupero Dati RAID FAsTec lo facciamo a mano con l'editor esadecimale.

Considerazioni finali

Volutamente non si è preso in considerazione l'argomento I/O performances, che rimane al top col RAID 10.

Se la quantità di spazio disponibile, in relazione al numero di bays disponibili, non è critica, è sempre meglio utilizzare un array di livello 6 invece che uno di livello 5, così da abbattere di molto la probabilità percentuale che l'eventuale rebuild di uno dei blocchi fallisca.