L’intelligenza artificiale è un fattore rivoluzionario nel processo di potenziamento ed evoluzione dei sistemi di sicurezza: grazie ai suoi algoritmi e alla capacità di apprendere dall’esperienza può rilevare e analizzare molti più fatti e comportamenti pericolosi, illeciti o sospetti, minimizzando il rischio di errori. Inoltre, può ridurre il carico di lavoro umano sollevando gli operatori delle sale controllo da compiti faticosi e ripetitivi senza (per ora) sostituirli completamente.
L’intelligenza artificiale applicata ai sistemi di sicurezza è un fattore altamente potenziante nelle fasi di analisi degli impianti antintrusione, antincendio, di controllo degli accessi e, soprattutto, di videosorveglianza, in passato monitorati dagli operatori delle sale controllo, con tutti i relativi limiti e potenziali errori.
Grazie all’AI, è possibile velocizzare l’analisi dell’enorme mole di dati ottenuti da questi sistemi di sicurezza, automatizzare e velocizzare le operazioni ripetitive (come per esempio il log degli accessi, la cronologia di funzionamento dei sensori, la ricerca delle targhe o dei lineamenti di una persona), lasciando gli operatori in carne e ossa liberi di dedicarsi a compiti più importanti (non ancora appannaggio dell’AI) come l’analisi dettagliata (post-AI), le decisioni e le azioni da intraprendere.
La vera forza dell’analisi AI sta quindi nella combinazione tra la componente umana e quella tecnologica, cioè nello sfruttare le soluzioni AI per aumentare l’efficienza di un operatore e ridurre i margini di errore. In futuro, grazie all’aumento esponenziale della capacità di calcolo, della qualità video e, soprattutto, grazie all’auto-apprendimento, l’intelligenza artificiale potrà svolgere molte più operazioni “umane”, con una rapidità e un grado di accuratezza e affidabilità maggiori, anche in ambito decisionale e strategico.
Machine learning e deep learning: cosa sono, quali differenze
ML (Machine Learning) è la scienza che permette di addestrare un programma o un sistema computerizzato allo scopo di eseguire attività senza istruzioni esplicite. I sistemi informatici utilizzano algoritmi ML per elaborare grandi quantità di dati, identificarne i modelli e prevedere risultati accurati per scenari sconosciuti o nuovi.
DL (Deep Learning) è un sottoinsieme del ML che utilizza algoritmi specifici chiamati “reti neurali”, ispirate a quelle del cervello umano. È proprio questo l’aspetto fondamentale che caratterizza l’applicazione dell’AI alla videosorveglianza: nessuna scena inquadrata è simile a un’altra, ovvero non esiste uno scenario “standard” da utilizzare come base per rilevare e anticipare comportamenti sospetti o pericolosi.
L’analisi in tempo reale dell’AI con auto-apprendimento serve quindi a perfezionare costantemente il rilevamento e renderlo più simile a quello umano, che raggiunge livelli molto più elevati grazie all’esperienza e all’intelligenza.
Un algoritmo AI viene sviluppato mediante un processo “iterativo”: si ripete un ciclo di raccolta, etichettatura e utilizzo dei dati di addestramento per istruire e testare l’algoritmo fino a raggiungere il livello qualitativo desiderato.
Visione artificiale base e avanzata
Quasi tutti i sistemi di videosorveglianza prodotti negli ultimi 5-6 anni supportano la “visione artificiale”, ovvero sono in grado di analizzare in tempo reale le riprese delle telecamere rilevando alcune tipologie di soggetti e oggetti (volto, persona, animale, auto ecc.) grazie ad alcune regole (statiche) stabilite dal produttore e inserite dal programmatore. Tutto ciò avviene senza ricorrere necessariamente all’intelligenza artificiale.
Gli algoritmi ML, invece, costruiscono automaticamente un modello matematico dinamico utilizzando grandi quantità di dati campione: le caratteristiche vengono comunque definite manualmente, ma il modo di combinarle viene imparato dall’algoritmo mediante l’esposizione a grandi quantità di dati di addestramento etichettati (annotati).
In un’applicazione ML, è quindi necessario addestrare il computer a ottenere il programma desiderato: i dati vengono raccolti e annotati dall’uomo, per poi essere inseriti nel sistema; il processo continua fino a quando l’applicazione impara a sufficienza per rilevare ciò che si desidera identificare, per esempio uno specifico tipo di veicolo (berlina, SUV, furgone ecc.), i lineamenti e le caratteristiche di una figura umana (altezza, corporatura ecc.), l’abbigliamento, gli accessori (borse, zaini ecc.).
Nel DL sia l’estrazione delle caratteristiche sia la loro combinazione in strutture profonde di regole per produrre un output vengono apprese dai dati. L’algoritmo può definire automaticamente le caratteristiche da cercare nei dati di addestramento e apprendere strutture molto profonde di combinazioni di caratteristiche concatenate. Il nucleo degli algoritmi DL si ispira infatti al funzionamento dei neuroni del cervello umano, che forma una conoscenza di livello superiore combinando gli output dei neuroni in una gerarchia profonda (rete) di regole concatenate.
Grazie alle reti neurali degli algoritmi DL, è possibile creare rilevatori ottici evoluti e addestrarli automaticamente a individuare oggetti molto complessi, anche se in posizioni differenti da quelle iniziali e in contesti critici (controluce, scarsa luminosità, altri disturbi ambientali ecc.).
Un rilevamento basato su DL può, per esempio, rilevare non solo i veicoli ma anche classificarli per tipo, marca e modello, da angolazioni e prospettive differenti, senza farsi influenzare dalle condizioni ambientali presenti sulla scena. Nonostante la netta superiorità (ma anche complessità) del DL, per le specifiche analitiche della videosorveglianza è spesso sufficiente utilizzare gli algoritmi ML.
Le fasi di sviluppo
Per sviluppare un’applicazione analitica di sicurezza basata su AI è necessario raccogliere grandi quantità di dati interessanti per l’analisi, ovvero accessi, cronologie, immagini e video di persone, veicoli o altri elementi registrati dai sistemi di sicurezza; i dati devono poi essere categorizzati ed etichettati.
L’addestramento (apprendimento) è la fase in cui il modello riceve dati annotati, utilizzando un’architettura logica di supporto per modificare e migliorare ciclicamente il processo fino a ottenere la qualità desiderata, cioè, essere “ottimizzato” per svolgere il compito prestabilito. L’apprendimento nell’ambito della sicurezza (in particolar modo nel caso della videosorveglianza) viene eseguito con metodo supervisionato, cioè basato su esempi.
I dati di input sono già abbinati ai risultati di output desiderati (annotati) e le prestazioni dell’algoritmo addestrato dipendono direttamente dalla quantità e dalla qualità dei dati di addestramento. L’importante è utilizzare un set di dati che rappresenti tutti i potenziali dati di input in una situazione di utilizzo reale.
Nel caso dei rilevatori di oggetti, lo sviluppatore deve sempre addestrare l’algoritmo con un’ampia varietà di dati, immagini e con diversi esempi di oggetti, orientamenti, dimensioni, condizioni di illuminazione e sfondi. Solo se i dati di addestramento sono rappresentativi per il caso d’uso previsto, l’applicazione analitica finale sarà in grado di effettuare previsioni accurate anche quando elaborerà dati nuovi, cioè mai rilevati durante la fase di addestramento. Tutte queste operazioni vengono effettuate in fase di programmazione delle telecamere (con AI integrata) o dei software di analisi dati/video esterni, aggiornate e istruite in modo continuo per affinare e velocizzare il riconoscimento.

AI per una sicurezza proattiva a 360 gradi
L’analisi video e dati basata sull’AI permette di discriminare le varie situazioni che si presentano durante l’attivazione di un sistema antintrusione, nel controllo degli accessi e nelle riprese video, ignorando le occorrenze meno importanti (come una serie di sensori che si attivano sporadicamente e senza una logica precisa, una persona che accede regolarmente a un tornello oppure cammina lungo un corridoio di un museo) e concentrandosi invece su quelle potenzialmente pericolose (sensori dello stesso gruppo o zona, accessi ripetuti e sospetti, una persona che si avvicina a un quadro o scaffale). Più gli algoritmi ML sono efficaci, auto-apprendenti e “allenati”, minori saranno i falsi allarmi, maggiori l’efficacia di rilevamento e le capacità proattive.
Dentro le applicazioni
Una delle applicazioni di analisi video che migliorano le prestazioni e l’efficacia di un impianto di videosorveglianza è la Motion Detection, sia in versione base sia in versione AI, che invia una notifica quando il sensore rileva un cambiamento di stato nell’inquadratura a causa del movimento di un oggetto, del passaggio di una persona o di un automezzo.
Altre applicazioni importanti sono quelle di Intruder Detection, Tripwire e Cross Line Detection, che rilevano le persone o gli oggetti in movimento all’interno di un ambiente il cui perimetro virtuale è stato precedentemente definito (per esempio, varchi d’ingresso, parcheggi, corsie riservate, aree di sosta vietata o limitate a particolari attività, aree museali e commerciali interdette al pubblico ecc.).

Per garantire la sicurezza nelle aree critiche, spesso affollate e a rischio furti, vandalismi o atti terroristici, si utilizzano le applicazioni di Abandoned/Missing Object e Face Detection (nel rispetto delle normative sulla privacy) per rilevare gli oggetti abbandonati o lasciati incustoditi (come una borsa che potrebbe contenere un ordigno), quelli rimossi per un furto (per esempio il quadro di un museo oppure il rilevatore di un sistema antintrusione) e i lineamenti di una persona sospettata di un crimine.

Altre applicazioni efficaci contro furti e vandalismi sono quelle di Loitering Detection e Stationary Vehicle Detection, che evidenziano la presenza di persone e veicoli fermi in un’area virtuale (tipo sportello bancomat o marciapiede) oltre il tempo predefinito, spesso sintomo di un appostamento, tentativo di intrusione o di occupazione abusiva.
La combinazione di queste applicazioni arricchite dall’AI può anche supportare le indagini delle forze dell’ordine e di quelle forensi, raggruppando in modo efficiente i dati video e rintracciando il volto/percorso di una persona o di un veicolo, identificandone la posizione precedente e l’ultima posizione nota.
Analisi video AI in ambito commerciale
L’analisi video AI è di grande importanza anche in ambito retail e marketing per migliorare le decisioni strategiche e operative attraverso dati di qualità e valore ottenuti dagli algoritmi ML. Tra le applicazioni più importanti si ricorda quella di People Counting, ovvero di conteggio automatico dei flussi di visitatori di negozi, centri commerciali, aeroporti, stazioni ferroviarie e altri centri di transito, strutture per l’intrattenimento, spazi educativi e culturali.
Questa funzione consente anche di rilevare l’interesse e il comportamento dei visitatori all’interno degli spazi retail (con particolare riferimento a campagne promozionali ed eventi speciali), ottimizzare i turni del personale (per esempio alle casse in presenza di code, nelle sale del museo oppure ai banchi del check-in in aeroporto), analizzare e condividere le statistiche rilevanti sulle presenze e sul conversion rate (rapporto visite/acquisti). Il tutto con precisione, affidabilità e funzionalità aggiuntive sconosciute ai sensori di passaggio.

Altre due importanti funzionalità “business oriented” sono quelle di Heatmap e Pathmap. Entrambe servono a ottimizzare i layout dei punti vendita, la disposizione dei prodotti e dei luoghi di erogazione dei servizi, il posizionamento delle isole commerciali monobrand, oltre che a valutare l’efficacia delle iniziative promozionali in-store e studiare percorsi guidati in determinati contesti (per esempio, nei negozi di arredamento), con la possibilità di generare avvisi automatici in caso di lunghe attese alle casse o nei singoli spazi commerciali (Queue Monitoring).
La funzione di Heatmap (mappa di calore) mostra graficamente l’occupazione di uno spazio nel tempo, utilizzando colori come rosso e arancio per le zone più frequentate e verde/giallo per quelle meno frequentate. Si tratta di uno strumento avanzato di analisi statistica che aiuta a comprendere meglio il comportamento delle persone nell’area di interesse, sia in termini di transito sia in termini di tempo di permanenza.
In ultimo (ma non meno importante), l’applicazione di Dwell Time contabilizza il tempo trascorso dai visitatori in specifiche aree e davanti ai totem informativi, per valutare l’interesse delle persone e studiare soluzioni per incrementarlo o dirottarlo su altre aree. Gli algoritmi AI sono fondamentali anche per stabilire con buona precisione la fascia di età e il sesso della clientela, sempre allo scopo di ottimizzare il layout del punto vendita, posizionare totem informativi/pubblicitari e studiare campagne promozionali ad hoc per i vari target.
Analisi dati AI negli altri sistemi di sicurezza
La videosorveglianza è l’applicazione che più di altre riceve benefici dall’analisi AI, per via dell’enorme mole di dati e metadati contenuti nelle riprese video. Altri impianti già citati - come quelli di antintrusione, antincendio e controllo degli accessi, che ormai operano in stretta sinergia con la videosorveglianza - possono sfruttare gli algoritmi AI per migliorare la sicurezza e ridurre i falsi allarmi.
Tutti questi sistemi infatti, soprattutto se ben integrati, possono raccogliere un’enorme quantità di dati utili a “formare” l’AI e a scoprire con largo anticipo il comportamento “normale” o “sospetto” degli ambienti e delle persone monitorati. Le eventuali deviazioni anomale da una linea base di comportamento, soprattutto se generata da dati storici, potrebbero infatti indicare eventi a cui il sistema di sicurezza deve reagire con alert poi verificati da operatori in carne e ossa.
Gli alert possono, per esempio, riferirsi a movimenti anomali captati da sensori volumetrici addestrati a discriminare la presenza di persone o animali, a rumori che l’AI identifica come “pericolosi” (per esempio, la rottura di un vetro o colpi forti alla porta d’ingresso), a zone del sistema antintrusione/antincendio più soggette ad allarmi in base alle condizioni ambientali, all’ora del giorno, ai dati storici sulla criminalità ecc.
Il continuo affinamento di queste valutazioni migliora l’esperienza dell’AI e la sua capacità di scoprire tutte quelle anomalie che molto spesso non sono “visibili” dall’uomo.



