Durante il primo giorno della terza edizione del Virtualization Field Day (#VFD3) una delle aziende che abbiamo incontrato (in qualità di delegati) è stata Pure Storage (nel loro splendido ufficio a Mountain View), azienda probabilmente nota (o vista ai vari VMworld) nell’ambito dello storage, soprattutto per ambienti virtualizzati.
Come azienda realizzano una soluzione di storage completa composta sia dalla parte software (completamente sviluppata da loro) che dalla parte hardware (in realtà utilizzando commodity hardware). Diciamo che in realtà sono una software company, visto che il vero core è dato da quella parte e che non producono direttamente l’hardware utilizzato (a meno della versione Lego del loro storage che capeggiava nella sala riunioni ed immagino fosse la stessa usata in questo concorso). La loro soluzione di storage di colloca in quella fascia di storage “full flash” (o potremmo dire “flash puro”).
Il realtà la loro soluzione è definita di tipo Forever Flash, anche se poi questo termine definisce più il tipo di servizio offerto. Cosa significa in pratica?
Con il programma Forever Flash è possibile aggiornare i propri controller ogni 3 anni per allinearli alle recenti novità introdotte da Pure Storage (e semplicemente svecchiarli vista l’evoluzione e l’obsolescenza dell’hardware), con il risultato di avere un sistema sempre aggiornato ed allineato alle ultime versioni (anche hardware) ed evitando il fastidioso effetto di cliclo di refresh forzato che si ha con molti storage tradizionali (e non), che spesso è anche di soli 3-4 anni (diciamo che in questo caso esiste lo stesso, ma in questo modo si ha come un servizio incluso nell’acquisto dello storage e nel suo canone di manutenzione).
Ovviamente il cambio di un controller (ma come del resto l’aggiornamento delle sue componenti software) può essere eseguito on-line sempre in modo non non-disruptive e senza alcuna interruzione (con altri storage, in alcuni casi invece va pianificato un intervento che corrisponde ad una temporanea interruzione del servizio). Non-Disruptive everything!
L’agenda dell’incontro si è rivelata decisamente ricca di contenuti ed informazioni:
- Welcome to Pure Storage: introduzione di Pure Storage, dell’azienda, della loro tecnologia e della loro cultura. Matt Kixmoeller, VP of Marketing, ha condiviso la loro vision.
- Advancing Virtualization with All Flash Storage: una discussione provocatoria ma ricca di spunti di interesse con Vaughn Stewart, Chief Evangelist, sulle sfide dello storage, in particolare nel mondo della virtualizzazione.
- VFD3 Surprise: una breve pausa 100% divertimento
- Everything You Always Wanted to Know About Flash: un conversazione tecnica di ottimo livello con Neil Vachhrajani, Software Engineer, riguardo alle tecnologie NAND flash. Un must per capire SLC, MLC, eMLC, Flash Resiliency, Program and Erase Cycles, Garbage Collection, Over Provisioning, Write Amplification, Data Reduction, …
- Demo di VMware su Pure Storage con Joel McKelvey, Product Marketing Manager
Il loro storage utilizza prevalentemente un approccio scale-in con un sistema a doppio controller e diversi cassetti dischi espansione, la ragione di questa scelta (se vogliamo un po’ in controtendenza rispetto a molte recenti architetture) è data da fatto che massimizzare lo scale-in invece (o prima) dello scale-out è più cost-effective. La scalabilità orizzontale (scale-out) diventa importante quando è necessario ampliare le prestazioni oltre i limiti offerti dalla scalabilità verticale (scale-in).
Al momento esistono due diversi tipi di controller (la serie FA-300 e la serie FA-400) ai quali possono essere collegati più FlashArray Expansion Shelf (ogni elemento occupa 2U e usa connessioni SAS a 6 Gb/s). Tra loro i controller sono collegati ad alta velocità e bassa latenza con connessioni InfiniBand e il modello implementato è quello di uno storage attivo/attivo ad alta disponibilità. Tutta la parte di front-end (la connettività verso gli host) può essere implementata con FC o iSCSI a seconda delle schede PCI-e che vengono inserite all’interno dei controller.
Tutta la parte software è implementa da Purity che di fatto è il loro “sistema operativo storage” (arrivato alla versione 3.0), implementato completamente da zero e pensato specificatamente per il mondo flash. In cuore di Purity è FlashCare™, in grado virtualizzare il livello sottostante degli SSDs e trasformarlo in un pool unificato di risorse. Sopra FlashCare girano i servizi di Purity che implementano resiliency, deduplication e compression e permettono di ottenere prestazioni consistenti dal FlashArray.
La parte software fornisce vari servizi tra i quali:
- Compressione: in grado di ridurre anche della metà i dati presenti, soprattutto in casi database-centric.
- Inline deduplication: il sistema utilizza un chunk size variabile che può arrivare (come dimensione minima) fino a 512 bytes in size. Più piccola è la dimensione del chunk, più efficace può diventare la deduplica.
- Thin provisioning: anche qua lavora con chunck da 512-byte in modo da sfruttare lo spazio al meglio.
- Snapshot: Pure Storage implementa una particolare tecnologia di snapshot chiamata ZeroSnap snapshot technology, caratterizza da uno zero-overhead in grado di ottimizzare lo spazio, ma di fornire vantaggi del tutto simili a snapshot di tipo full clone (in termini di prestazioni ed usabilità).
- Space-Efficient RAID Protection: Pure Storage utilizza una versione proprietaria di RAID-6 chiamata RAID-3D caratterizzata da un’ottima protezione dei dati e da un basso overhead.
- Predictable Performance: buona parte della tecnologia sviluppata da Pure Storage è pensata per ottenere prestazioni predicibili fino alle frazioni di millisecondi, ma anche per ottenere la massima durata dagli SSD. vi è molta matematica dietro questi aspetti ed è stata citata la legge di Little (a riguardo ho trovato questa interessante ricerca in ambito 3D e storage, che magari è stata pure usata da Pure Storage e potrebbe spiegare lo strano nome dato al loro RAID).
Come si può notare nello schema precedente, il livello di storage sottostante si basa sulle memorie flash di basso di tipo MLC Solid State Drive per cercare di mantenere basso l’impatto del loro costo. Abbiamo trascorso un po’ di tempo a parlare di SLC, EMLC, MLC e delle tecnologie flash in generale, ma oltre al discorso costo vi è anche da considerare il discorso affidabilità, visto che in linea generale le unità MLC potrebbero essere meno durevoli di quelle SLC. Ma molto dipende anche dallo storage e Pure Storare dichiara in avere avuto sono 5 unità in fault in questi anni (vero che con l’aumentare degli anni questi numeri dovrebbero aumentare). Molto si deve alla parte software e tra l’altro i FlashArray hanno una garanzia di 5 anni su tutti i componenti hardware, compresi gli SSD.
Forse il principale dubbio che si può avere su tecnologie full flash è se veramente siano convenienti. Del resto è esattamente la prima cosa che mi chiedo in questi casi ed è evidente che il costo per Giga o i normali parametri di CapEx o OpEx potrebbero non giustificare la scelta. Bisogna entrare più nel dettaglio dei TCO e del ROI per dare una risposta più sensata.
Sul sito di Pure Storage esiste una pagina dedicata con delle risposte, che potremmo sintetizzare in questa frase:
At Pure Storage, we have a very simple target: we believe that all-flash storage can be significantly less expensive than traditional spinning-disk storage on a $/GB usable basis, typically 50% the cost of performance disk storage. And if you are willing to also account for space and power savings, as well as for the server consolidation benefits of faster storage, you are likely to find you can save another 50% by moving from spinning disk to all-flash. Even more compellingly, the above analysis assumes only a 5X data reduction, a target Pure Storage has exceeded on nearly all of the customer workloads we have tested to date.
Ovviamente considerando anche il programma Forever Flash la soluzione diventa appetibile e più l’analisi si estende oltre i 3 anni e più diventa interessante. Ma per le PMI ovviamente il discorso è un altro e questo tipo di storage è poco proponibile.
Per maggiori informazioni (in inglese) vedere anche:
- Pure Storage @#VFD3 (Tech Field Day 3 – Virtualization)
- Tech Field Day VFD3 – Pure Storage and the all-flash revolution
- Should You Consider Pure Storage as your Next Array?
- #VFD3 Day One – Pure Storage has 99 problems but a disk ain’t one
- The Customer Experience Is The Key To Success In Today’s Array-Based Storage Environment
Disclaimer: Sono stato invitato a questo meeting da GestaltIT e che ha coperto i costi per il viaggio e l’alloggio. Ma non sono stato ricompensato in alcun modo per il mio tempo e non sono in obbligo di scrivere articoli riguardo all’evento stesso e/o gli sponsor. In ogni caso, i contenuti di questi articoli non sono stati concordati, rivisti o approvati dalle aziende menzionate o da altri al di fuori del sottoscritto.