Come configurare al meglio RAID in sistemi NAS
I sistemi RAID (Redundant Array of Independent Disks) sono una tecnologia consolidata per l’archiviazione dati affidabile e sicura. Le aziende, le piccole imprese e persino i privati li utilizzano perché, rispetto all’utilizzo di un singolo hard disk (HDD), un sistema RAID è in grado di proteggere i dati più importanti dai guasti dei supporti di archiviazione, è più economico, migliora le prestazioni e aumenta l’affidabilità.
Così come diverse configurazioni di RAID possono essere più o meno adatte a una determinata applicazione di archiviazione, esistono diversi modi per configurare i NAS (Network Attached Storage) e il loro comportamento varia a seconda delle circostanze. Per questo motivo, secondo Toshiba è importare comprendere le sottili differenze tra le diverse configurazioni per decidere quale adottare.
I sistemi RAID sono tradizionalmente definiti come un insieme di unità di archiviazione installate in un unico sistema, ma trattate come se fossero singoli dispositivi di storage. Una caratteristica importante è la disponibilità a livello aziendale, ovvero che un sistema RAID rimanga attivo, funzionante e accessibile agli utenti di rete qualificati solo per pochi minuti all’anno. I dati vengono protetti mediante il mirroring o utilizzando uno schema di parità in cui i dati persi possono essere recuperati ricalcolandoli dalle informazioni ancora esistenti. Esistono molti modi per configurare un sistema RAID e ognuno di essi porta una diversa designazione numerica, da RAID0 a RAID60.
I sistemi NAS, invece, includono un sottosistema di archiviazione RAID collegato alla rete e possono essere dotati di un numero variabile di dispositivi di archiviazione che sono generalmente HDD, anche se a volte vengono utilizzati gli SSD. I sistemi NAS di tipo desktop dotati di due hard disk sono adatti a molte applicazioni, ma non sono rare le configurazioni con quattro drive e alcune ne contengono fino a otto. I sistemi enterprise, spesso montati su rack, possono ospitare 12, 16 o addirittura 24 HDD.
Come si comportano le varie configurazioni RAID con le diverse impostazioni NAS? Per la valutazione del livello RAID, Toshiba si è concentrata sui più diffusi modelli base a due e quattro alloggiamenti. Il laboratorio HDD di Toshiba ha testato diversi sistemi NAS di vari produttori, ciascuno equipaggiato con una scheda di rete 10 GbE per evitare colli di bottiglia nella connettività di rete e ha testato ogni NAS con due e quattro HDD MG08ADA400E di classe enterprise da 4 TB di Toshiba.
Sono stati archiviati 6 TB di dati nel sistema e misurato le prestazioni per: scrittura sequenziale di blocchi da 1 MB; lettura sequenziale di blocchi da 1 MB e lettura casuale; carico di lavoro combinato di lettura e scrittura di un insieme di blocchi di diverse dimensioni. Inoltre, sono state testate le configurazioni che utilizzano controller RAID hardware o controllo RAID software. Per due o quattro drive, il RAID hardware è il metodo di gestione più comune e adeguato. Tuttavia, con una potenza di calcolo ad alte prestazioni e costi contenuti (CPU, DRAM, ecc.) i sistemi RAID possono essere gestiti anche interamente dal software, con il vantaggio di offrire funzionalità di archiviazione aggiuntive come snapshot, backup e altro.
Broadcom MegaRAID 9560-8i e Adaptec® SmartRAID 3204-8i di Microchip sono i due controller RAID hardware testati più diffusi sul mercato per sistemi con un massimo di otto drive. Per quanto riguarda lo storage basato su software, è stato testato Zettabyte File System (ZFS) gestito dal software Open-E JovianDSS.
Tabella 1: Risultati delle misurazioni per QNAP NAS (SW = SeqWrite, SR = SeqRead, M = Mixed)
I valori delle prestazioni sequenziali per i sistemi NAS con configurazioni RAID sono significativamente inferiori a quelli dei controller RAID hardware, mentre le prestazioni casuali sono simili a quelle di ZFS senza cache.
Confrontando RAID5 e RAID10, RAID5 è circa il 20% più veloce in termini di velocità sequenziale e RAID10 è il 20% più veloce in termini di carichi di lavoro casuali/misti.
La maggior parte dei sistemi NAS è ancora dotata di un’interfaccia da 1GbE o 2,5GbE, quindi è necessario sottolineare che i valori delle prestazioni sequenziali da 200 MB/s e superiori richiedono come minimo un’interfaccia da 10GbE. L’uso di un’interfaccia da 1GbE riduce la velocità sequenziale a circa 100 MB/s, inferiore a quella di un singolo HDD. L’utilizzo di un’interfaccia da 2,5GbE aumenta invece la velocità massima a 250MB/s, sufficiente per una configurazione RAID1 a 2-Bay. Solo con 10GbE è possibile raggiungere velocità superiori a questo valore.
Pertanto, qualsiasi compromesso o ottimizzazione in termini di velocità sequenziale è rilevante solo per le reti a 10GbE o a velocità superiore. Per le infrastrutture di rete da 1GbE e 2,5GbE, due HDD in RAID1 sono sufficienti. Solo per carichi di lavoro con molti accessi casuali in lettura/scrittura, 4 drive in RAID10 possono garantire un aumento della velocità di circa 1,5 volte.
“Quando gli amministratori dei sistemi di archiviazione valutano le configurazioni di storage di rete, sia che si tratti di una configurazione RAID in generale o NAS in particolare, devono prendere in considerazione una serie di fattori come la capacità necessaria, il carico di lavoro tipo e le limitazioni imposte dall’host”, ha dichiarato Rainer W. Kaese, Senior Manager, HDD Business Development, Toshiba Electronics Europe GmbH.
Dopo i test effettuati, per le configurazioni RAID nei NAS Toshiba suggerisce:
– RAID1 (mirroring semplice) di due drive di capacità elevata è la configurazione ideale per i sistemi NAS economici nelle case e nelle piccole imprese con connettività di rete a 1GbE o 2,5GbE.
– RAID5 (protezione di parità) di quattro drive è il migliore per tutti i tipi di sistemi di archiviazione in cui la maggior parte del carico di lavoro è di tipo sequenziale, ed offre la migliore efficienza di archiviazione (75%). È quindi ideale in caso di esigenze di capacità netta elevata e garantisce tempi di ripristino più brevi in caso di sostituzione di un drive guasto.
– RAID10 (striping e mirroring) di quattro drive: è il migliore per i carichi di lavoro casuali/misti, ovviamente a fronte di un’efficienza di archiviazione inferiore, pari solo al 50%. RAID10 è consigliato per i sottosistemi di archiviazione dei server locali per carichi di lavoro generici che utilizzano controller RAID hardware o tecnologia RAID software.