Durante il secondo giorno della terza edizione del Virtualization Field Day (#VFD3) una delle aziende visitate (in qualità di delegati) è stata Coho Data, una nuova (e molto interessante) startup che si aggiunge nell’arena già piena (ma non satura) degli storage enterprise. L’azienda ha iniziato con il nome di Convergent.io con lo specifico obiettivo di cambiare il modo con il quale lo storage viene implementato e gestito.
Questo incontro è anche stata l’occasione per annunciare ufficialmente la General Availability (GA) della loro soluzione di Web-Scale Storage Appliance per l’Enterprise.
Formalmente sono una software company, ma nella pratica la loro soluzione è già pre-pacchettizata ed include sia la parte software che la parte hardware. Questa scelta potrebbe far storcere il naso, ma oltre ad essere adottata da vari altri vendor di storage, ha anche una sua motivazione: prevalentemente quella di ridurre la lista di compatibilità (HCL) e potersi così concentrare sulla parte software. L’intera architettura è ben descritta (in inglese) nel loro sito web o nei vari video del #VFD3 .
Soluzione modulare…
L’intero DataStream Chassis è una soluzione di Storage building block composta da un sistema rack di 2 unit con dischi frontali (e non condivisi), due alimentatori condivisi (in ridondanza) e due MicroArray (di fatto 2 server). Ogni chassis è in grado di fornire 39TB di capacità di storage e può scalare di un MicroArray alla volta in modo molto lineare in base alle proprie esigenze.
Ogni singolo MicroArray è basato su :
- 2 processori Intel Xeon E5-2620
- 2 schede PCIe flash di tipo Intel 910 Series 800GB
- 6 dischi da 3TB SATA (montati nella parte frontale dello chassis comune)
- 2 schede di rete da 10Gb
La soluzione è definita “Open Hardware”, con l’accezione che non è propriamente di tipo hardware independent, ma è ragionevolmente Open e comunque basata di componenti di tipo Commodity, visto che l’hardware è di tipo Supermicro, nella versione high density system. La scelta di usare in sistema con due miniserver, invece che quello con quattro è dettata soprattutto dalla possibilità di espansione dei miniserver, in termini di schede PCIe.
Inoltre la soluzione è chiamata “Open Hardware” perché Coho Data implementa uno strato di virtualizzazione (data hypervisor) per rendere il più possibile indipendente dall’hardware il proprio sistema di storage, creando un qualcosa di simile a quanto avviene nel mondo dei server.
…Con approccio Scale-Out
La soluzione Coho Data è di tipo scale-out storage che promette scalabilità lineare e con prestazioni prevedibili e deterministiche: ogni singola unità può fornire 180K IOPS (80% read/20% write, 4K random) e come scritto in precedenza si può scalare a piacere da una singola unità a più in base alle proprie esignenze ed in modo completamente lineare.
A partire dal prossimo anno dovrebbe anche essere introdotto un modello più potente per scalare ancora più velocemente, ma sempre con i concetto di aggiungo capacità+prestazioni ogni volta.
…Completamente Converged
Questa soluzione non è solo un buon esempio di Software Defined Storage (SDS), ma include al suo interno anche soluzioni di tipo Software Defined Network (SDN) che rendono l’intera soluzione unica.
L’intera soluzione DataStream è composta da (almeno) un DataStream SDN-enabled switch da 10GbE e da (almeno) uno chassis 2U DataStream con uno o due MicroArrays (descritti in precedenza).
Lo switch fornito è una versione “rimarchiata” di un modello Arista con funzioni OpenFlow, usate sia per semplificare il deployment dell’infrastruttura, sia per definire i percorsi ottimali dei flusso di storage.
Se è abbanza semplice capire come SDN possa aiutare nel deployment come pure nel management (con tanto di gestione centralizzata nella stessa interfaccia, gestione delle informazioni e degli aggiornamenti degli switch), merita sicuramente qualche parola in più il modo con cui SDN è utilizzato per la selezione del percorsi.
Attualmente Coho Data espone un unico NFS name space (altri protocolli sono nella roadmap), come del resto fanno altri storage. Ma è abbastanza unico il modo di come viene utilizzato questo name space NFS: per semplificare la configurazione e permettere un approccio molto scalabile viene utilizzato un singolo indirizzo IP uguale per tutti (in questo modo la configurazione lato client NFS è veramente semplice. Sarà lo switch (o meglio il piano di controllo di Coho) poi che selezionerà il percorso corretto per permutare un client (client lato storage, ma server nel mondo reale, o quanto meno host di virtualizzazione) su un link a 10 Gpbs. In caso di guasto verrà selezionato un altro percorso.
Può sembrare una scelta azzardata (o quanto meno strana), ma è importante premettere che non c’è bisogno che le varie interfacce NFS lato storage parlino tra di solo. Per la comunicazione tra i microarray si utilizza una rete privata (che per semplicità non è disegnata nello schema precedente). In questo modo l’intera soluzione diventa sensata e volendo anche geniale nella sua semplicità.
Da notare, che anche se SDN è utilizzato nella parte storage, non è obbligatorio che venga usato anche nel resto della rete.
E, naturalmente, è possibile avere una configurazione ridondata degli switch relativi allo storage, introducendo un secondo switch. In questo caso SDN diventa anche lo strumento per autoconfigurare il collegamente tra i due switch (tramite un LAG) e selezionare il percorso migliore in base al costo minore (di fatto tenedo client e server sullo stesso switch fisico, a meno di problemi di rete).
…Ibrida e non Full Flash
Questo prodotto si propone di dare una risposta a due crossi problemi nel mondo storage:
- problema 1: il costo dello storage flash non è lo stesso del costo per disco tradizionale
- problema 2: le soluzioni di flash host-side non sono una soluzione a tutti i mali possibili
Per questo non viene adottata una soluzione full flash, come pure non vengono utilizzati SSD visto che poi il collo di bottiglia sarebbe il bus SAS.
Coho Data ha condotto diversi test e simulazioni su SSD e schede PCI flash alla ricerca di soluzioni ottimali, ma anche per vedere il livello di saturazione e il costo:
- una scheda Intel PCIe flash costa $5/GB e può fornire $.08/IOP (quindi una scheda 800GB flash corrisponde a 50K IOPS, 0.1 di latenza e costa $4K)
- un disco standard da 3TB costa $.08/GB e fornisce $1.67/IOP (150 IOPS, 10ms di latenza, con un costo di $250).
Per queste ragioni la soluzione di Coho Data è uno storage di tipo ibrido che riassume il meglio dei due mondi.
Vanno poi considerati anche altri aspetti e in particolare le differenze tra caching e tiering e il fatto che in diversi casi possa andare meglio uno rispetto all’altro (tra l’altro vi sono poi diversi tipi di cache policy come del resto diversi tipi di tiering policy). Coho Data usa un sistema di flash-first tiering ottimizzato per sfruttare al meglio la memoria flash e ottenere prestazioni ottimali e deterministiche.
…Veramente interessante
Vi pare abbastanza interessante come soluzione? Personalmente ritengo che sia unica nell’approccio e nel modo con cui combina SDS e SDN!
E sicuramente considero sia stato molto apprezzabile e pure illuminante sentir parlare della soluzione direttamente da Andrew Warfield CTO e da Forbes Guthrie, Technical Product Manager ma anche noto e riconosciuto autore di libri, speaker e blogger. Le presentazioni di entrambi sono state veramente ottime.
Vi sono poi tanti altri aspetti che rendono la soluzione interessante e il supporto per VAAI sarà fin da subito disponibile. Del resto al momento la soluzione è pensata soprattutto per ambienti basati su VMware vSphere, ma Coho Data non vuole proporre una soluzione di nicchia solo per questo ambiente e dovrebbe presto estendere il supporto ad altri ambienti di virtualizzazione e probabilmente anche ad ambienti fisici.
Ultimo, ma non per questo meno importante, è la semplicità di gestione e sopratutto la velocità di deployment: una volta posizionato in armadio rack e cablato, la soluzione DataStream si installa e configura in 15 min (da quando si accende a quando si può utilizzare).
…Senza punti deboli?
Ci troviamo di fronte ad una versione 1.0 del prodotto quindi sarebbe utopistico pensare che sia privo di punti deboli o lacune.
Prima di tutto, in questa versione iniziale viene esposto solo il protocollo NFS3 adatto per ambienti vSphere, ma non per altri e comunque in alcuni casi anche un accesso a blocchi sarebbe comunque interessante. In realtà il design è molto scalabile e sarà possibile aggiungere altri protocolli e metodi di accesso:
Nella roadmap vi sono già iSCSI e SMB, ma probabilmente anche altri datastream tra quelli indicati nella figura precedente.
Discorso analogo per gli hypervisor: al momento nasce soprattutto per VMware vSphere, mentre Hyper-V non rientra nei piani a breve termine di Coho Data; ma non vuol dire che sia nei loro sistemi previsti da supportare. Più interesse è dimostrato per Openstack: tanto che sono alla ricerca di potenziali progetti (in quel caso basta contattarli).
Un altro limite apparentemente grande è in come SDN viene utilizzato per selezionare il percorso dati: solo un percorso alla volta (tra client e server) può essere possibile. Questo semplifica il multipath (nel senso che proprio non serve), ma complica l’uso di più percorsi alla volta. Una soluzione potrebbe essere creare un secondo datastore NFS con un altro IP target in modo da usare un percorso su un datastore e un altro sul secondo. Peccato che nella versione attuale si possa creare solo un singolo datastore NFS. Nelle prossime versioni saranno possibili anche più datastore ciascuno con differenti indirizzi IP.
Ulteriori informazioni
Per maggiori informazioni è possibile vedere questi altri post e link (in inglese):
- Field Day delegates descend on Coho Data
- Coho Data video at #VFD3
- Tech Field Day VFD3 – Coho Data – Coho-ly Moly this is a cool product!
- Initial Musing about Coho Data Scale Out Networking
- Don’t Let Raw Storage Metrics Solely Drive Your Buying Decision
- Designing the Next Generation vSphere Storage Systems
- #VFD3 Day 2 : Kicking it with Coho
Esistono anche un interessante post in italiano:
Disclaimer: Sono stato invitato a questo meeting da GestaltIT e che ha coperto i costi per il viaggio e l’alloggio. Ma non sono stato ricompensato in alcun modo per il mio tempo e non sono in obbligo di scrivere articoli riguardo all’evento stesso e/o gli sponsor. In ogni caso, i contenuti di questi articoli non sono stati concordati, rivisti o approvati dalle aziende menzionate o da altri al di fuori del sottoscritto.