Nel mio incontro con Amplidata, durante il recente evento Powering the cloud, ho avuto modo di parlare con Tom Leyden (Director of strategic alliances and marketing).
Amplidata è specializzata nella realizzazione di sistemi di Object Storage ottimizzati per i “Big Data”, il tutto garantendo massima affidabilità e disponibilità, ad un prezzo (per TB) il più possibile contenuto. L’azienda, fondata nel 2008, ha la sede europea principale a Lochristi, nel Belgio (vanta anche alcuni clienti sul suolo italiano). Ovviamente ha anche una sede negli Stati Uniti e più precisamente a Redwood City, California.
Il nuovo CEO, Mike Wall, si è insidiato il 2 novembre 2011 e ha contribuito all’espansione dell’azienda e all’aumento delle relative quote di mercato. Recentemente ha anche recuperato altri $6M di fondi (chissà perché queste cose non succedo in Italia?!).
Tra i loro partner si annoverano diverse aziende tra le quali anche Quantum (dove hanno sviluppato un prodotto congiunto bastato sulla tecnologia AmpliStor® XT) e anche Intel (nel molteplice ruolo di partner, fornitore di tecnologia e pure di investitore).
La loro soluzione di object storage è basata su due differenti elementi base:
- Controller node, chiamato anche AmpliStor Controller
- Storage node
Gli AmpliStor Controller sono server ad alte prestazioni, basati su piattaforma standard Intel Xeon (hanno anche provato altre soluzioni, come ad esempio gli Atom, ma senza il desiderato livello di prestazioni) con a bordo il software Amplidata BitSpread, MetaStore, management framework. L’accesso avviene tramite più interfacce 10 GbE e con vari protocolli inclusi http/REST object interfaces, e alcune interfacce specifiche a particoli linguaggi come Microsoft .Net, Python o C. Ogni controller ha anche schede aggiuntive 10 GbE per la parte di collegamento di back-end agli storage pool. I controller agiscono in un cluster ad alta disponibilità che fornisce accesso condiviso, metadata caching (in high-performance SSD) e protezione di metadata. Per maggiori informazioni vedere l’AmpliStor data sheet.
Gli storage node sono delle unità rack alte 1 U, con differenti capacità a seconda del modello (AS20 ha 20TB e AS30 ne ha 30). Per avere una corretta configurazione servono almeno 8 blocchi (e si arriva quindi facilmente e velocemente a parlare nell’ordine dei PetaByte…). Naturalmente il target principale degli object storage rimane la gestione dei dati non strutturati, e il maggior numero di casi d’uso si hanno nell’ambito media & entertainment. Ma gli object storage sono anche alla base di servizi come Google Drive, Amazon, … E alcune soluzioni di public cloud solutions (come ad esempio il servizio di backup e archiviazione fornito da McCloud) sono basati proprio su sistemi Amplidata.
La scalabilità è garantita sia aggiungendo nuovi storage node (in questo caso si incrementa solo la capacità), ma sia aumentando il numero dei controller node, in questo caso aumentano sia le prestazioni che il throughput totale.
Interessante è come gestiscono questa grosse mole di informazioni, senza usare le tradizionali soluzioni di RAID che sarebbero poco scalabili. solutions that are not so scalable. Utilizzano invece l’erasure coding che è una forma di correzione di errore, già usata in vari ambiti da diversi anni. Il vantaggio principale è rappresentato dalla maggior velocità di gestione della ridondanza e in tempi di rebuild di poche ore, rispetto ad alcuni giorni necessari per soluzioni basate sul RAID (quando applicate a dischi di grosse dimensioni).
Per maggiori informazioni, vedere anche:
Vedere anche: Altri report dell’evento Powering the Cloud 2012.