Nel mio incontro con Actifio, in occasione del recente evento Powering The Cloud, ho avuto modo di parlare con Andrew Gilman (Senior Director of Global Marketing) e Ann Karolin Thueland (Director Marketing EMEA).
L’azienda rientra nelle cosidette storage “start-up”, ma ha già una sua storia (è stata fondata da Ash Ashutosh nel luglio 2009) e tra l’altro è nata nel Massachusetts, anziché nella “solita” Silicon Valley. Inoltre rispetto a molte altre start-up che realizzano soluzioni simili tra di loro (almeno da un punto di vista concettuale), qua i fondatori hanno cercato una particolare esigenza e hanno cercato di proporre una soluzione specifica per soddisfarla. In Europa l’azienda ha sedi in Gran Bretagna, Olanda e Germania.
La considerazione (o scoperta) era che che le aziende spendevano molto (o troppo) per i dati “non caldi”, come ad esempio i backup e gli archivi. Se poi estendiamo questa analisi a tutti gli altri dati duplicati, chiamati “copy data“, come ad esempio le snapshot, i dati per gli ambienti di sviluppo e test, … si scopre che il problema della crescita è molto serio: già nel 2006 lo storage cresceva linearmente per quanto riguarda la produzione, ma esponenzialmente per i copy data! E nel 2013 il costo dei “copy data” ha superato il costo dei dati di produzione (IDC Insight document, March 2013 #239875).
E quindi hanno inventato un modo per ridurre lo spazio occupato dai copy dati creando una soluzione di “Copy Data Management”.
Il loro approccio è di non toccare la produzione, mantenendo anche gli investimenti attuati in tale senso e non mischiandosi con di soluzioni di storage già esistenti e/o emergenti.
Bensì creano uno storage di copy per un accesso unificato con i seguenti punti chiave:
- I dati modificati vengono catturati una sola volta in modo univoco
- Vengono memorizzati e spostati solo i dati deduplicati
- E’ possibile accedere instantaneamente a qualunque virtual copy per qualunque scopo
- Singola interfaccia, appplication–centric, SLA–driven
- Soluzione unica e completa per l’intera infrastruttura: virtuale / fisica, cloud / locale, applicazioni di terze parti o altri storage vendor
La loro soluzione, giunta alla versione 6.0 (annunciata lo scorso agosto) è completamente software basata su hardware standard (o comodity hardware) ed è pensata per massimizzare il data capture (anche da ambienti fisici particolare come i sistemi iSeries o ambienti Unix proprietari), ridurre il data movement e ottimizzare la capacità dello storage usando operazioni di deduplica (a livello globale) e compressione in background.
La cattura dei dati avviene in modo diverse a seconda dalla sorgente: per ambienti VMware si utilizza la particolare funzione delle vStorage APIs for Data Protection chiamata Changed Block Tracking™ (CBT), per database si utilizza RMAN (per Oracle) o specifiche AppAPI, per i file server ed in generale per i server fisici esiste un Actifio Connector in grado di fornire anche tecniche di snapshot.
L’aspetto (e l’approcio) decisamente interessante è l’uso di un unico strumento per tutti i dati non di produzione, andando quindi a rendere concettualmente inutili (o meglio andando a sostituire) i sistemi i backup e di archiviazione il tutto con un’interfaccia multi-tenant e role based, gestibile tramite diversi device (inclusi tablet e smartphone) oppure tramite REST API.
Ovviamente, dovendo anche porsi come soluzione di backup e protezione dei dati, deve fornire funzioni adatte a questo ruolo. In particolare da un lato fornire numerose funzioni per portare attivi i dati: restore, clone, live clone. Incluse funzioni di restore di singolo file, singola mail, SharePoint, … e diversi applicativi ed interi sistemi (usando la Bare Metal Recovery). Dall’altro lato deve fornire funzioni di protezione e dati adatta ad una logica di ridondanza anche geografica ed in particolare fornisce funzioni di replica (con una tecnologia proprietaria ma integrabile integrated con VMware vCenter Site Recovery Manager) di tipo:
- sincrona: fino a siti distanti massimo 300KM
- asincrona: adatta in tutti gli altri scenari o dove la banda geografica è un potenziale collo di bottiglia
Altrettanto interessante è la funzione per creare worflow di varia natura, usabili per implementare dei failover test, ma anche per per creare dati per sviluppatori. In tutto in una logica multi-tenant adatta la permettere e regolamentare l’uso a diversi team e ruoli.
Tra l’altroad ogni applicazione è possibile associare (manualmente o tramite la funzione di autodiscover) diversi SLA per definire la frequenza delle snapshot, il tipo di storage da utilizzare, il tipo di replica e la relativa frequenza, la retention dei dati, …
Per maggiori informazioni è disponibile (in inglese) un white paper che descrive how does this solution work.
Conclusioni
La soluzione sviluppata e proposta è sicuramente interessante e potrebbe anche ridefinire il modo con cui vengono gestiti i dati non di produzione passando da tante soluzioni e silo diverse ad un unico ambiente. L’interfaccia multi-tenant basata sui ruoli e sugli SLA permette poi di lasciare la gestione ai diversi team per le diverse competenze senza dover quindi stravolgere i flussi e le logiche già adottate.
Va però ripensata l’architettura che passa da diverse soluzioni per le diverse necessità da un’unica unificata per tutti i “copy data”. Tra l’altro con la possibilità di montare live i dati presenti anche l’organizzazione dei dati di produzione (si pensi a dati storici di fileserver o mail archiviate) potrebbe essere rivisto secondo questo modello.
Chiaro che molte funzionalità sono già presenti in soluzioni specifiche per un particolare ambito (in particolare quello dei backup) la l’idea di raggruppare tutti le diverse necessità in un’unica soluzione è decisamente innovativa e probabilmente verrà presa come spunto anche da altre soluzioni (già oggi vi sono alcune soluzioni di backup che integrano funzioni di archiviazione e DR).
Vedere anche: Altri report dell’evento Powering the Cloud 2013.