Regent
Applicazioni
 

31/01/2020

Share    

Le nuove colonne di un data management che fa i conti con il cloud

La migrazione verso il cloud dei database aziendali impone una profonda revisione delle strategie di gestione dei dati.

Informazioni

 

Il cloud sta cambiando le architetture IT in profondità e nel percorso di trasformazione digitale che molte realtà stanno portando avanti, a un certo punto arriva il momento di mettere in discussione i modelli adottati e consolidati negli anni, se non nei decenni, relativi alle strutture dati finora utilizzate in azienda. Il cloud sta quindi ridisegnando profondamente l’approccio ai Dbms e di conseguenza anche le politiche e le strategie di data management.

La ragione è presto detta, oggi più che mai la trasformazione digitale ha come traguardo l’azienda ‘data driven’, ossia un’impresa ‘moderna’ in grado di interpretare e generare nuovi business dalla molteplicità di dati che può raccogliere dalle vecchie e nuove attività che si svolgono al suo interno, ma che possono essere anche correlati con fonti di informazioni esterne. La ‘data driven company’ ha però bisogno di flessibilità, di rapidità e quindi anche di prestazioni che sono per forza molto più elevate di quelle del passato, e per soddisfare questa esigenza l’offerta oggi più che mai propone il cloud.

Non è una coincidenza infatti che i principali fornitori storici di soluzioni database – IBM, Microsoft e Oracle – siano anche fornitori importanti del mondo dei servizi cloud, mentre AWS ha da tempo lanciato Aurora come database nativo cloud proprio per ‘cavalcare’ questa transizione, e anche per generare nuove opportunità di business: ai clienti non propone solo di portare i loro database storici nel suo cloud, ma anche, una volta spostati questi workload, di migrare dall’ambiente originario non ottimizzato per il cloud al suo db costruito appositamente per sfruttare al meglio le caratteristiche del nuovo ambiente. I vendor storici si stanno attrezzando, come Oracle con Autonomous Database, ma nuovi vendor che si sono fatti le ossa con Hadoop – Cloudera e MapR – sono anch’essi della partita con soluzioni cloud native.

Gli analisti di mercato sono oggi quindi concordi nel ritenere che il futuro dei Dbms è nel cloud e che invece l’implementazione di strutture db negli ambienti onpremise rappresenti sempre più il passato.

Il cloud non è più un’opzione
Secondo Gartner entro il 2022 il 75% dei database sarà implementato o sarà migrato su una piattaforma cloud. “A essere coinvolte inizialmente sono generalmente le strutture dati a supporto delle analytics, come data warehouse e data lake, e delle elaborazioni di machine learning e intelligenza artificiale che sempre più verranno implementate nei prossimi anni – spiega Donald Feinberg, Gartner distinguished research vice president. I db transazionali più tradizionali, invece, prendono la strada del cloud quando l’azienda decide di adottare la modalità software-as-a-service per l’applicazione che utilizza quella determinata struttura dati”.

Le imprese che vogliono rimanere competitive, secondo Gartner, saranno obbligate a muoversi verso il cloud. Le innovazioni relative ai db verranno realizzate prima per questi ambienti, e anzi la logica che vedrà il rilascio dei futuri sviluppi dei prossimi anni si sposterà dal ‘cloud first’ al ‘cloud only’. Rimanere al di fuori di questo fenomeno è quindi molto rischioso.

La buona notizia è che questo passaggio però sarà graduale, nessun vendor di database cambierà le sue politiche di sviluppo dell’offerta in modo radicale dal giorno alla notte: “Le innovazioni continueranno a essere sviluppate anche per le versioni onpremise dei database, ma magari arriveranno con ritardo rispetto a quanto invece verrà rilasciato per il cloud”, spiega Feinberg.
Ma questo scenario come va interpretato dal punto di vista del data management?

Dati sottocontrollo dall’onpremise al multicloud
Certamente si dice una banalità quando si afferma che sempre più dati, e sempre più di diversa natura, sono destinati a entrare in azienda, e che i volumi degli stessi sono destinati ad aumentare notevolmente. Ma le cose stanno esattamente così. Insieme ai dati strutturati generati dalle applicazioni transazionali, già oggi troviamo una miriade di informazioni destrutturate: quelle gestite dai sistemi di posta elettronica, i log web e dei sistemi fissi e mobili… A questi molte aziende affiancheranno i dati provenienti dai sensori sia IoT che non IoT, che magari saranno stati raccolti da sistemi edge alla periferia della rete aziendale; per non contare poi anche la possibilità di raccogliere immagini e video dalle quali si possono estrarre informazioni utili attraverso il machine learning e l’intelligenza artificiale.

Gran parte delle attività legate alla gestione dati si svolgeranno nel cloud, soprattutto per ragioni legate ai costi, alla flessibilità e alla vicinanza a dove questi dati vengono generati, che implica in partenza, per raggiungere questo scopo, la possibilità di utilizzare più fornitori cloud. Sempre più spesso le aziende infatti non hanno relazioni con un solo fornitore cloud e lavorano con un approccio multicloud. Una data driven company si troverà quindi nella situazione di movimentare o copiare grandi volumi di dati attraverso le sue infrastrutture sia onpremise che cloud, o per meglio dire multicloud. L’IT di un’azienda data driven deve quindi rivedere o comunque rafforzare le sue strategie di data management applicando anche i nuovi concetti che stanno emergendo in questo periodo di cambiamenti significativi.

Data fabric
Data fabric è il nuovo concetto architetturale che per prima cosa racchiude tutte le risorse infrastrutturali e cloud utilizzate da un’azienda per gestire i suoi dati. Include quindi lo storage onpremise, i servizi cloud, i sistemi edge e quant’altro conservi i dati aziendali. In un ambiente data fabric sono però presenti anche tutti quei servizi che consentono di gestire i dati in modo consistente lungo tutto il loro ciclo di vita. Dal momento in cui viene creato a quando finisce la sua vita, e quindi viene eliminato, l’ambiente Data Fabric consente di gestire il dato applicando le stesse logiche ovunque esso sia memorizzato, nei diversi sistemi onpremise utilizzati dall’azienda e nei repository dei diversi fornitori cloud, qualunque sia il tipo di dato.

Data governance
Più le regole di compliance vengono rafforzate e più le capacità di data governance si devono dimostrare versatili per supportare un’ampia varietà di requisiti business critical. Le politiche di compliance, controllo del rischio e governance devono essere tradotte in regole per creare dei sistemi di controllo in grado di soddisfare le regole più esigenti di normative come il GDPR e il NIST 800. Le disposizioni relative alla classificazione dei dati e alla loro conservazione e sovranità devono essere implementate seguendo le best practice nei sistemi di Information Lifecycle Management, mentre l’operatività quotidiana sui dati deve essere continuamente monitorata.

Data security
Con l’aumentare dei dati da gestire aumentano i rischi e le problematiche di sicurezza. Nel momento in cui i dati iniziano a viaggiare in un contesto multicloud, allora è bene pensare di implementare le funzionalità di protezione più avanzate come la crittografia, la sicurezza basata su regole di comportamento, il mascheramento dei dati e il loro continuo monitoraggio. Tutti i dati più sensibili, quelli che devono essere trattati secondo normative di legge, e quelli relativi alla criticità del business è bene che viaggino all’interno del data fabric aziendale sempre in modo crittografato.

Data discovery
Se non l’avete già implementato nella vostra architettura dati è importante, per diventare un’azienda data driver, implementare un sistema di data discovery nelle vostre architetture dati. Un sistema di data discovery fornisce un ‘catalogo’ centralizzato di metadati che descrivono gli elementi di base utilizzati nei database aziendali, come le tabelle, le viste e gli indici. Con molti dati replicati più volte nelle infrastrutture onpremise e multicloud, il data discovery aiuta analisti, sviluppatori e data scientist a trovare e a visualizzare rapidamente i dati di cui hanno bisogno per svolgere le loro attività di business.

 
TAG: Database

TORNA INDIETRO >>