This post is also available in: Inglese

Reading Time: 6 minutes

Durante l’ultima edizione dell’IT Press Tour (la 14ma e la prima alla quale ho avuto l’onore di partecipare), svoltasi nella Silicon Valley (nel periodo dal primo a 5 dicembre 2014), abbiamo avuto l’occasione di incontrare molte aziende in differenti aree (Cloud, Storage e Big Data).

L’ultima azienda che abbiamo incontrato durante l’ultima giornata del tour è stata Platfora, un’azienda che opera nel campo dei big data. In realtà il venerdì io ero in viaggio di ritorno dalla Silicon Valley, ma ho avuto modo di seguire la sessione in differita.

ITPressTour-LogoPlatfora è un’azienda relativamente recente (fondata nel 2011) con base a San Mateo (ovviamente nella Silicon Valley) e caratterizzata da un tasso di crescita esponenziale negli ultimi anni (i clienti crescono di un fattore 4x e i dipendenti di un fattore 2x). Nel 2014 hanno anche aperto un ufficio in Europa e nel 2015 sono intenzionati ad aprire un ufficio in un altro continente (immagino l’Asia).

Ben Werther (Founder e CEO) e Peter Schlampp (VP Products) hanno spiegato la vision e mission aziendale e quali sono i fattori che differenziano questa azienda da altre nello stesso settore.

Hadoop-LogoPlatfora combina la gestione dei big data, utilizzando nativamente Hadoop (la più famosa soluzione di gestione di grossi volumi di dati) con un sistema di analytics molto potente e veloce (e semplice) in grado di accedere al 100% dei dati. La loro soluzione è probabilmente la prima soluzione di BigData Analytics che operi nativamente su Hadoop. Alcuni l’hanno definita (in senso positivo) una soluzione di Big Data for Dummies, ma in realtà non è solo quello.

Uno degli aspetti più cruciali legati ai BigData non è tanto lo “stoccaggio” di questi dati (in effetti c’è Hadoop che va benissimo allo scopo, o comunque vi sono varie soluzioni di Object Storage in grado di memorizzare grossi quantitativi di dati)… il problema è poi l’analisi di questi dati in tempi soddisfacenti e possibilmente in modalità anche interattiva (ad esempio per creare scenari di what-if o per analizzare in dettaglio alcuni risultati).

E qui i BigData Analytics e la Business Intelligence (BI) tradizionale (o più in generale gli approcci Data Warehouse 1.0) spesso si sovrappongono e in alcuni casi i (grossi) problemi si affrontano ancora con approcci tradizionali, costringendo ad elaborare i dati dalla piattaforma di BigData, portarli in un ambiente strutturato per poi affrontarlo con approcci di BI tradizionali… il tutto però con un dispendio di tempo e di risorse.

Platfora invece è in grado di operare direttamente e in modo efficiente sui dati memorizzati in Hadoop.

The key slide to understand why @platfora is pretty unique http://t.co/P2tu1LUlxM #ITPT #BigData #Analytics #Hadoop

Platforma combina la gestione dei Big Data con funzioni di Analytics per realizzare una piattaforma end-to-end in grado di gestire dati multi-structure con funzioni di self-service, modalità iterattive ed interattive, il tutto in maniera semplice e veloce.

Ma perché è così importante gestire i dati di tipo multi-structure? Perché oramai i BigData non sono solo tanti dati, ma sono anche originati da tante sorgenti (storicamente) diverse come quelli relativi ai dati di business (customer analytics), quelli derivanti da log e sistemi di sicurezza (security analytics) e quelli derivanti dal crescente mondo dell’Internet of Things (tutti quei dispositivi nuovi in grando di inviare dati). Ma quello che serve è un sistema in grado analizzare e correlare i dati da tutte queste sorgenti. Si pensi, ad esempio, alla possibilità di migliorare o profilare un sito web in base al modo con cui viene navigato, al tipo di dispositivi che vi accedono, ma anche in base ai feedback raccolti dai social media o ai trend del momento.

Platfora-Multi-Structure

Platfora si caratterizza quindi per queste funzioni:

  • multi-structured data support
  • interactive visual analytics
  • segmentation and behavioral analysis
  • extensible app platform

Ovviamente affinché sia pure efficiente è necessario che i dati non siano analizzati direttamente da quelli presenti nel cluster Hadoop e nel filesystem HDFS (i tempi per analisi interattive partendo direttamente da questa fonte di dati sarebbero inaccettabile). Altre soluzioni usano magari più ambienti di staging per elaborare i dati, portarli su sistemi più strutturati e/o più veloci per poi far partire l’analisi di tipo “business intelligence”.

In questo caso l’approccio è differente: Platfora prevede una fase di preparazione dei dati che vengono elaborati e caricati in memoria in modo da diventare estremamente veloci per poi eseguire l’analisi che puà anche essere interattiva. Questo set di dati pre-elaborato e pre-ottimizzato viene chiamato (nella piattaforma Platfora) “lente”.

Platfora-Architecture

Inoltre Platfora fornice un tool di analisi dei dati caratterizzato da un linguaggio molto potente, ma allo stesso modo simile an un linguaggio di interrogazione dei dati (tipo SQL) che può anche essere utilizzato in modalità visuale e, come già detto, anche in modalità interattiva lavorando direttamente sui risultati (ad esempio per aumentare il dettaglio dei risultati o per vedere cosa succede variando alcuni parametri).

L’interfaccia è veramente molto semplice, veloce ma anche molto efficace. Nella pagina dedicata al prodotto è possibile notare alcuni schermate e come sia possibile ottenere alcuni risultati estremamente potenti e dettagliati. L’intera interfaccia è completamente multi-utente e basata sui ruoli, ma non solo. Rappresenta anche uno strumento di collaboration che permette di condividere informazioni, commenti o lavorare in più persone sugli stessi dati.

Al momento questa interfaccia non ha funzioni native di multi-tenant (probabilmente saranno introdotte in versioni future), ma già qualcuno ha creato soluzioni di tipo SaaS basate su questo prodotto, visto che l’intero ambiente è comandabile tramite Restful-API.

In Italia al momento non vi sono clienti, ma come già scritto l’ufficio in EMEA è stato aperto solo da questo anno. Sicuramente le problematiche relative all’analisi efficiente dei BigData potranno solo aumentare (dato che i dati continuano ad aumentare) e non è quindi impensabile immaginare di vedere simili soluzioni diffondersi anche nel mercato italiano (o almeno in una sua parte).

Vedere anche:

Disclaimer: Sono stato invitato a questo evento da Condor Consulting Group che ha coperto i costi per il viaggio e l’alloggio. Ma non sono stato ricompensato in alcun modo per il mio tempo e non sono in obbligo di scrivere articoli riguardo all’evento stesso e/o gli sponsor. In ogni caso, i contenuti di questi articoli non sono stati concordati, rivisti o approvati dalle aziende menzionate o da altri al di fuori del sottoscritto.

Share

Virtualization, Cloud and Storage Architect. Tech Field delegate. VMUG IT Co-Founder and board member. VMware VMTN Moderator and vExpert 2010-24. Dell TechCenter Rockstar 2014-15. Microsoft MVP 2014-16. Veeam Vanguard 2015-23. Nutanix NTC 2014-20. Several certifications including: VCDX-DCV, VCP-DCV/DT/Cloud, VCAP-DCA/DCD/CIA/CID/DTA/DTD, MCSA, MCSE, MCITP, CCA, NPP.