officeautomation-settembre 2012 - page 45

43
settembre 2012
L'ICT in azienda
Faccia a faccia con
gli utenti
Come procedete per gestire e analizzare i dati de-
strutturati derivanti da fonti esterne?
Secondo me, occorre definire due principali fonti
esterne: governate e non governate. Quelle gover-
nate sono sicuramente identificate e catalogate al-
meno secondo la loro tipologia; per esempio: testi
normativi, circolari, sentenze… Di questi si conosce
a priori l’argomento trattato.
Quelle non governate possono essere le informa-
zioni recuperate da Internet come per esempio: le
informazioni presenti sui social network, sui forum,
sui blog che cambiano continuamente tipologia
di argomento. In questo caso risulta più comples-
so individuare gli argomenti di interesse, con una
frequenza elevata di aggiornamento nel tempo.
Fatta questa distinzione come si deve operare?
Nel primo caso, le fonti sono facilmente gestibili
e possono essere integrate nelle banche dati; nel
secondo caso, occorre dotarsi di strumenti che
consentano un aggiornamento in real time delle
informazioni e che siano in grado di catalogarli e
creare delle relazioni con i dati preesistenti. Que-
sti strumenti devono essere capaci di reperire le
informazioni destrutturate presenti nella rete, in
modo puntuale e sempre aggiornato, e di affinare
al meglio la categorizzazione dei documenti ‘noti’.
Penso che l’uso di algoritmi costruiti sulla dinamica
associativa possano sicuramente aiutare sia nella
fase di indicizzazione dei dati che nella fase di anali-
si. Sono inoltre necessari strumenti che consentano
una semplice navigazione del dato e componenti
statistici preconfigurati nel sistema al fine di co-
struire delle dashboard in tempi brevi.
Quali sono le soluzioni infrastrutturali che abilita-
no la gestione dei Big Data?
Allo stato attuale sia il mercato che il mondo open
source non offrono molto e quello che viene pro-
posto non corrisponde ancora completamente ai
desiderata, anche se i framework come Hadoop
supportano applicazioni distribuite con elevato
accesso ai dati e permettono alle applicazioni di
lavorare con migliaia di nodi e petabyte di dati.
Nel campo dell’hardware vengono offerte nume-
rose soluzioni sempre più performanti, anche se il
costo attuale è ancora elevato. Sono molto inte-
ressanti le appliance che integrano prodotti per la
gestione Big Data con performance ottimizzate.
Quali sono le criticità e i rischi connessi con l’uti-
lizzo dei Big Data?
Siamo ancora indietro nell’analisi dei dati destrut-
turati e in particolare nell’analisi semantica dei testi
La sede centrale di Soluzioni per il Sistema Economico (Sose)
Un particolare del data center Sose. Comprendendo le attività di
backup, l’infrastruttura gestisce circa 3 petabyte di dati all’anno
1...,35,36,37,38,39,40,41,42,43,44 46,47,48,49,50,51,52,53,54,55,...100
Powered by FlippingBook