Nel corso degli ultimi anni, i termini Converged infrastructures (CI) e HyperConverged Infrastructures (HCI), in italiano a volte tradotti come infrastrutture convergenti e iper-convergenti, sono diventati di uso comune; benché spesso non se ne capisca il vero significato.
Un po’ come è successo con altri termini (si pensi a cloud), a volte vengono usati più per questioni di marketing che per vere e prorie ragioni tecniche.
Del resto, nel mondo degli storage, è successo lo stesso con il termine Software Defined Software (SDS), usato spesso a sproposito: di fatto la maggior parte degli storage sono software-based, ma questo non li qualifica come software defined (esattamente come parlare di virtualizzazione non qualifica la soluzione come una soluzione di tipo cloud).
Durante l’ultimo Tech Field Day 16, è scaturita un’interessante discussione, durante la presentazione di NetApp da parte di Adam Carter, Chief Architect at NetApp.
Tutta la presentazione, anziché puntare sulla descrizione di un proprio prodotto, è stata incentrata su cosa e come si possa qualificare una soluzione come una soluzione di tipo HCI.
Del resto il termine HCI in sé non vuol dire nulla, o meglio, vuol dire tante cose diverse… persino rimanendo nel campo informato, il primo significato che compare non è quello aspettato, bensì Human-Computer Interaction.
Anche la definizione formale HyperConverged Infrastructures (HCI) è abbastanza lacunosa. Nonostante vi siano alcune imprecisioni, Wikipedia tenta di fornirne una:
In 2012 Steve Chambers and Forrester Research coined the marketing term hyper-converged infrastructure (HCI) to describe a fully software-defined IT infrastructure that virtualizes all of the elements of conventional “hardware-defined” systems. HCI includes, at a minimum, virtualized computing (a hypervisor), a virtualised SAN (software-defined storage) and virtualized networking (software-defined networking). HCI typically runs on industry-standard commercial off-the-shelf (COTS) servers.
Il focus è sul fatto che si integrano parti di virtualizzazione e parti di SDS (la parte di SDN in realtà non è necessaria, benché possa essere utile), il tutto su hardware di tipo COTS. E’ sicuramente un buon punto di partenza, ma questo poteva andar bene all’inizio della storia dell’HCI.
Ma la definizione cambia ed evolve nel corso del tempo, dato che nuove soluzioni e nuovi vendor sono entrati in questo mercato.
Tra l’altro va anche notato che all’inizio manco si usava questo termine, e uno dei precursori (anzi forse chi ha veramente aperto questa strada) non lo ha usato, né normalmente lo usa: Nutanix preferisce un altro termine, “web-scale”, che si focalizza più su uno dei benefici dell’HCI (utilizza altresì altri termini, come ad esempio “Invisible Infrastructure” sempre per focalizzarsi sui benefici dell’HCI).
E in effetti, cercare di definire cosa possa esser HCI, partendo dai benefici può essere un punto di vista interessante. Quello che ci si aspetta da una soluzione HCI è (in ordine sparso):
- che sia semplice da acquistare, ad esempio un solo (o pochi) SKU che includano tutto (o quasi)
- che sia semplice da installare e configurare, magari con un buon wizard, o con pochi click
- che abbia una parte di gestione molto potente, flessibile, ma anche semplice; non importa quanto sia complessa la struttura tecnicamente, ma la gestione deve essere semplice
- che sia semplice da espandere, ma anche da dimensionare; con livelli di prestazioni attesi semplici da pianificare e capire.
- che possa abilitare ad un modello di tipo cloud, sia per quanto riguarda la modalità di consumo (ad esempio tramite un self-service) che il modello di costo
Chiarito questo aspetto di come si possa ragionare sui risultati attesti, a questo punto la discussione è passata sulle possibili soluzioni implementative, dove in effetti si apre un nuovo scenario (il terzo):
- per ogni host, utilizzare un hypervisor e una VM per implementare la parte di storage
- per ogni host, utilizzare un hypervisor che già includa anche la funzionalità di storage
- utilizzare un approccio totalemente diverso slegando la parte di nodi di hypervisor da quelli di storage
Le prime due non richiedono molte spiegazioni, visto che sono i modelli classici delle soluzioni HCI.
La prima prevede una VM per ogni host che funzioni come “Storage Processor” per parte di storage. In effetti è proprio così che il tutto ha avuto inizio: si pensi alle soluzioni Nutanix e Simplivity.
Ma già su questo modello, che oramai sembra assodato, vi sono alcuni interessanti commenti da fare: basta dire di avere una VM che svolga le funzioni di “storage controller” per qualificare la soluzioni come una soluzione di HCI? Molti risponderebbero di sì e secondo la definizione di Wikipidia sarebbe anche corretto.
Però se pensiamo ai benefici attesi da una soluzione di HCI, allora la risponsta sarebbe no, se mancano ad esempio caratteristiche scalabilità e/o di gestibilità. Potremmo quasi pensare ad un HCI v1.0 dove bastava avere una VM di storage (si pensi anche al primo tentativo di VMware) che però nel corso del tempo si è evoluta in HCI v2.0 (dove il tutto doveva essere più semplice da gestire e da installare), fino ad una ipotetica HCI v3.0 (i numeri sono puramente indicati, ma per far capire che sicuramente siamo ad una terza, o quarta, ondata di prodotti e soluzioni HCI).
Il secondo approccio invece è nato con un ipotetico HCI v2.0, dove la parte di storage è stata inclusa all’interno dell’hypervisor (o potremmo anche dire a livello di kernel), il tutto nell’ottica di semplificare il più possibile sia parte di installazione che quelle di configurazione e gestione.
Si pensi a VMware con la sua Virtual SAN, ma anche ad altre soluzioni come Microsoft S2D o Scale Computing.
In questi casi sicuramente già si parlava di HCI e le soluzioni sono nate proprio con l’idea di soddisfarne i requisiti funzionali ed i relativi benefici. Qua non vi sono grossi dubbi nel definire ognuna delle soluzioni precedenti una vera a propria soluzione nella categoria HCI.
Però ci sono, anche qua, delle precisazioni. Prendiamo il caso della VSAN di VMware e pensiamo al diverso spettro possibile di soluzioni: partendo dalla soluzione “build your own” dove bisogna costruirsi la soluzione, passando a quella con i VSAN Ready Nodes (dove almeno il nodo è progettato e verificato per la soluzione stessa), arrivando a soluzioni come VxRail o VxRack dove anche il processo di installazione è fortemente semplificato. Diciamo che soluzioni quali VxRail/Rack o la stessa VMware Cloud Foundation rappresentano un ipotetico HCI v3.0, in virtà della maggiore integrazione e semplicità di gestione.
A questo punto si è arrivati alla terza soluzione. Per molti opinabile o non qualificabile come soluzione HCI “pura”. Però partiamo dal concetto che se la soluzione soddisfa i requisiti di una soluzione HCI e ne garantisce i benefici, perché non la possiamo chiamare soluzione HCI?
In questo approccio (che poi è quello usato da NetApp SolidFire) si hanno nodi indipendi per la parte di hypervisor e la parte di storage, ma il tutto con mantenendo gli stessi benefici delle soluzioni HCI.
Certo è forzato considerare questa una soluzione di tipo HCI, soprattutto se pensiamo ad un ipotetico HCI v1.0… ma in fondo perché no? NetApp ovviamente aveva l’interesse a posizionare questo approccio nella categoria HCI, altri posizionano approcci simili in altre categorie.
Ma è chiaro è un approccio possibile e comunque un trend emergente, che sicuramente non andrà ad annullare gli altri approcci, poiché ogni approccio ha i suoi benefici e ovviamente i sui contro.
Questo diagramma, in conclusione della presentazione, ha cercato di definire i pro e contro di ogni approccio:
Per vedere l’intera presentazione (in inglese):
Vedere anche gli altri commenti da parte dei delefati del #TFD16: