Mitel
Applicazioni - Sicurezza
 

02/07/2015

Share    

Visioni artificiali: oltre la sicurezza

In uno scenario futuro nel quale si registrerà una crescente preponderanza dei dati video anche in contesti B2B, la computer vision è il tassello tecnologico fondamentale per abilitare una nuova generazione di applicazioni.

Quelli video rappresentano una grossa fetta dei contenuti prodotti oggi in digitale fornendo un enorme universo potenziale di informazioni utili a diversi ambiti
Con il termine computer vision, o visione artificiale, si intende quella disciplina che nell’ambito dell’ingegneria informatica studia più nel dettaglio lo sviluppo di metodi che permettano a un computer di comportarsi in modo simile agli esseri umani a livello percettivo e visuale, nella sostanza estraendo dati semantici da quanto viene visto dall'obiettivo di una telecamera e registrato sui supporti di destinazione. Di fatto, si parla dell'applicazione di tecnologie che, partite già almeno a livello di idea negli Anni '70 quando si cominciò a parlare per la prima volta di riconoscimento del volto e, quindi nel decennio successivo, con le prime opere che discorrevano di visione percettiva.
Da una decina di anni, queste hanno subito un grosso impulso grazie all’introduzione di calcolatori sempre più potenti e di sistemi di ripresa e memorizzazione interamente digitali che hanno lo scopo ultimo di osservare le persone (ma non solo, come vedremo in queste pagine), identificarne i movimenti e la tipologia di attività e, quindi, utilizzare i dati elaborati per una moltitudine di applicazioni che vanno dalla sicurezza - sorveglianza, identificazione di individui e comportamenti sospetti, gestione di catastrofi - al marketing per identificare comportamenti e pattern di acquisto negli store con conseguente posizionamento di articoli e informazioni nelle zone più adatte.
Uno spettro di attività che offre una serie di opportunità a più settori compresi retail, sport, scuola, manifatturiero e sanità. Qualcosa di sostanzialmente impossibile da raggiungere nella precedente era, quella che definiamo più propriamente analogica.

Il mercato ‘video analytics’

Prima di addentrarci maggiormente nel dettaglio di questi sistemi, vediamo alcuni dati di mercato. Secondo quanto riportato dallo studio Global Intelligent Video Analytics Market 2014-2018 pubblicato da Research & Market, per quanto riguarda il comparto definito anche 'video analytics' si parla di un tasso di crescita composto del 34% nel quinquennio in oggetto, e questo guidato da un incremento sempre maggiore di dati video non strutturati e dalla conseguente richiesta di strumenti in grado di estrarre significato da quanto viene ripreso.
Le analisi di mercato partono in particolare dallo storico settore della video sorveglianza, e quindi della video intelligence, sollecitato ormai da diverse tipologie di utenza finale per condurre attività di tutela dei propri beni e strutture sempre più sofisticate. Rimane però un problema secondo gli analisti per un vero impulso, ossia l'ancora scarsa consapevolezza delle reali capacità che questo tipo di soluzioni possono offrire per migliorare l'operatività delle aziende nel loro complesso. Qualcosa però sta cambiando.

Gioco di squadra

Quello della computer vision, di fatto, è un tema sul quale oggi esiste una stretta collaborazione tra mondo accademico e produttori di tecnologia. Diversi sono infatti i corsi universitari dedicati all'utilizzo di software, spesso basati su componenti open source, che permettono la realizzazione di una moltitudine di applicazioni che vanno a toccare svariati campi di impiego a partire sì dalla sicurezza – che resta ancora probabilmente il più noto – ma poi coinvolge anche i comparti della sanità, così come quello dell'intrattenimento. Il compito dei ricercatori, tra i quali si vantano anche diverse eccellenze italiane, è in particolare quello di risolvere alcuni nodi legati a questo tipo di tecnologie, con diversi passi avanti che sono stati già compiuti permettendo di avere a disposizione situazioni certamente molto più efficaci rispetto a solo qualche anno fa.
Il primo problema da risolvere, come ha spiegato Rita Cucchiara, Professore Ordinario di Sistemi di Elaborazione delle Informazioni dell’Università degli Studi di Modena e Reggio Emilia, in occasione del recente evento Video Intelligence Conference organizzato da Soiel International a Milano, è il fatto che nella sostanza si lavora su immagini bidimensionali, quando invece il mondo reale è tridimensionale e va quindi in seguito ricostruito a fini di analisi. In alcuni casi esistono poi riprese piene di rumore e imprecisioni tanto da non poter essere comprese al meglio nemmeno dall'occhio umano; infine esiste la necessità di elaborare i video in tempo reale e possibilmente a un costo ridotto.
Ma la computer vision è, nella realtà, un tema estremamente ampio che tocca anche il cosiddetto recupero e analisi delle informazioni e dei contenuti finalizzati all'acquisizione di quella conoscenza che si 'nasconde' all'interno dei cosiddetti big data. Ossia quell'insieme ormai molto discusso di dati non strutturati, e di varia natura e origine, prodotti in modo massiccio e in misura costante dei quali i video rappresentano ormai una grossa fetta (le stime parlano di oltre il 60%) la quale viene tra l'altro molto spesso veicolata sfruttando tecnologie di streaming. Ed è anche per questo che emerge la necessità di poterli elaborare in tempo reale e nel modo più accurato possibile, se si vuole riuscire a ottenere il massimo valore nel momento più opportuno.
Si tratta di uno scenario che, in generale, ha visto i suoi contorni scolpiti da una evoluzione tecnologica innescata dall'aumento della risoluzione di ripresa garantita dai sensori incorporati nelle telecamere digitali, per cui se un tempo si parlava di qualche centinaio di gigabyte al giorno prodotto e memorizzato nei sistemi di storage, oggi i volumi trattati risultano essere cento volte superiori. Prodotti da installazioni cittadine e aziendali così come da singoli utenti desiderosi di condividere qualcosa in rete, con tutte le conseguenze che si possono immaginare in termini di spazio occupato, ma anche di opportunità di conoscenza mancate se non si è dotati degli strumenti di analisi adeguati.

Computer vision oggi e domani

In definitiva la computer vision sfrutta sistemi molto complessi che elaborano le immagini, eseguono analisi dei movimenti, trattano ombre e artefatti e, infine i comportamenti delle persone e di quanto li circonda. Dal punto di vista tecnico un sistema di questo tipo svolge prima di tutto una elaborazione in locale a livello di sensore che - spiegano gli esperti - può essere paragonata, con i limiti del caso, a quanto avviene sulla nostra retina, per poi proseguire sulle macchine, il nostro cervello. Su questi sistemi le immagini vengono effettivamente memorizzate e affidate agli algoritmi di analisi e calcolo più avanzati per la ricostruzione della prospettiva, la percezione reale di colori, forme, movimenti e profondità dell'immagine, fino a un uso importante dell'intelligenza artificiale sfruttando anche principi di neurofisiologia e psicologia della percezione.
Solo per fare qualche esempio, in un dato ambiente come può essere la piazza di una città questi sistemi consentono di identificare la presenza di mezzi di trasporto, leggerne le targhe, misurare gli edifici intorno, quantificare le persone presenti e riconoscerle da sole o come gruppo all'interno di una folla con una precisione sempre maggiore, valutando se uno stesso individuo è passato più volte in quel punto e se si sta spostando all'interno di un determinato insieme. Il tutto in uno scenario dove il presente è già caratterizzato anche dall'utilizzo di sistemi embedded fronte apparati e da quello delle infrastrutture cloud che possono rappresentare un ausilio decisivo per svolgere le attività di acquisizione, memorizzazione ed elaborazione dei dati video. Insomma, il futuro della computer vision è già qui e copre tante applicazioni e tutto questo grazie ad alcune tecniche ben definite che permettono non solo di elaborare immagini per produrne semplicemente altre, bensì anche di estrarre informazioni e… comprensioni.

 

TORNA INDIETRO >>