Un algoritmo in quattro step per cinque continenti

La tecnologia ANPR di Hikvision può essere impiegata in tutto il mondo grazie a soluzioni flessibili e intelligenti basate sul machine learning (AI) per analizzare e identificare qualsiasi targa con grande precisione, affidabilità e rapidità.

La videosorveglianza appli­cata al controllo dei mezzi di trasporto è sempre più diffusa, sia in ambito gestionale (pa­gamento parcheggi e pedaggi, controllo accessi ecc.) sia nella sicurezza (rilevamento infrazioni, indagini fo­rensi ecc.).

Esistono varie tecnologie utilizzate per leggere e identificare le targhe degli automezzi (ANPR), che si differenziano per procedura utilizzata, algoritmi impiegati e altri fattori. Non tutti i software ANPR, tuttavia, possono operare a li­vello globale, perché gli algoritmi o le immagini campione vengono addestrati per riconoscere solo alcune decine di targhe e non le centinaia o migliaia impiegate nei cinque continenti.

La tecnologia ANPR di Hikvision, invece, uti­lizza sofisticati algoritmi di machine learning per estendere le capacità di riconoscimento del sistema a qualsiasi targa, con un basso margine d’errore.

Quattro step per l’identificazione

Uno dei punti di forza della tecnologia ANPR di Hikvision è l’estrazione di numeri, lettere e simboli dalle targhe con isolamento dal resto dell’inquadratura, spesso costellata di elementi che possono ingannare il software di ricono­scimento. Gli algoritmi utilizzati dall’azienda permettono invece di rilevare la targa con un rischio di errore minimo, isolando ogni elemento e partizionando i caratteri per poi procedere con il riconoscimento.

Bilayer plate processing - La tecnologia Hikvision permette di stabilire quali sono gli elementi identificativi chiave anche nel caso di TARGHE COMPOSTE DA DUE O PIÙ RIGHE, ignorando numeri e lettere ininfluenti ai fini della procedura ANPR (anno di immatricolazione, Paese, regione ecc.).

La tecnologia non si basa sul colore o sulla strut­tura dei caratteri delle targhe dei veicoli - come avviene in altri software ANPR che richiedono un lungo lavoro di addestramento (caricamento immagini di targhe da tutto il mondo, specifiche layout ecc.) - ma è in grado di distinguere le tar­ghe “mono-riga” (come quelle europee) e “dop­pia-riga” (americane, mediorientali ecc.) senza pregiudicare il riconoscimento di ogni singolo elemento grafico e alfanumerico.

La procedura di identificazione si basa su quat­tro step:

  • posizionamento approssimativo,
  • fil­traggio della targa,
  • posizionamento preciso
  • post-processing (riconoscimento caratteri).

Posizionamento approssimativo

La procedura di localizzazione approssimativa opera in base al contrasto tra lo sfondo e i carat­teri della targa, indipendentemente dalla com­binazione di colori (per esempio, sfondo bianco e caratteri neri, sfondo nero e caratteri bianchi, sfondo giallo e caratteri neri ecc.). Il software ANPR scansiona ogni singolo fotogramma del video catturato dalla telecamera di sorveglianza alla ricerca di questi elementi a forte contrasto.

POSIZIONAMENTO APPROSSIMATIVO - Il software ANPR scansiona ogni singolo fotogramma del video catturato dalla telecamera di sorveglianza alla ricerca degli elementi a forte contrasto che sono sintomatici della presenza della targa.

Componenti dei veicoli, arredi urbani, cartelloni­stica e altri elementi presenti nell’inquadratura possono ingannare il software in questa prima fase, ma si tratta di un’occorrenza perfettamen­te normale trattandosi della primissima fase di rilevamento.

Filtraggio della targa

Lo step successivo è l’applicazione di un filtro basato su sofisticati algoritmi capaci di discrimi­nare in modo rapido, preciso ed efficace le targhe da qualsiasi altro elemento. Se gli elementi identificativi presenti negli al­goritmi confermano che si tratta di una targa reale, si passa allo step successivo – altrimenti il “crop” della ripresa video viene scartato.

Filtraggio della targa

L’im­magine catturata dalla telecamera non è quasi mai identica a quella di una targa fotografata di fronte o scannerizzata, perché l’angolo di ripresa può variare di parecchi gradi, l’immagine risulta sfocata per via del movimento ecc.

Posizionamento preciso

Il terzo step consiste nel rilevamento dei contor­ni della targa, indipendentemente dalla presen­za di lettere e numeri di identificazione su una o due righe. Per quest’operazione si utilizza lo stesso metodo (effetto contrasto) di cui sopra: il software esamina lo sfondo, i caratteri e gli altri elementi stabilendo con precisione i bordi reali della targa e definendo l’area da sottoporre ad analisi e riconoscimento.

Posizionamento preciso

L’algoritmo di rilevamento dei caratteri permette anche di stabilire quali sono gli elementi iden­tificativi chiave delle targhe composte da due o più righe e ignorare numeri e lettere ininfluenti ai fini della procedura ANPR (anno di immatri­colazione, Paese, regione ecc.).

Post-processing e riconoscimento dei caratteri

Completata la fase di delimitazione dei bordi della targa (superiore e inferiore), si passa agli step di post-processing, come il posizionamento dei moduli carattere nell’area d’interesse e il loro riconoscimento.

Esistono vari metodi per delimitare il rettangolo circoscritto dal carattere alfanumerico, ciascuno con i propri vantaggi e svantaggi:

  • POST-PROCESSING E RICONOSCIMENTO CARATTERI

    Proiezione verticale: è un metodo che identi­fica le depressioni delle onde negli spazi tra i caratteri (per individuarli e separarli) osser­vando le proiezioni. Non è in grado di stabi­lire dove si trova il bordo sinistro del primo carattere e, pertanto, non va utilizzato come metodo unico ma in combinazione con altri.

  • CCL (etichettatura dei componenti collegati): ogni carattere è una regione connessa oppure ha una parte connessa. È possibile estrapolare la regione connessa dall’immagine per ottene­re la forma del carattere, ma il rumore presen­te nell’immagine ripresa potrebbe degradare le regioni di caratteri diversi e interferire con l’identificazione della partizione dei caratteri.
  • Corrispondenza modello: si tratta di un meto­do utile per individuare esattamente la posi­zione del carattere e la sua struttura, ma solo dopo aver utilizzato altre applicazioni (come la proiezione verticale). Purtroppo, nel mondo esistono centinaia di targhe con forme e layout differenti, per cui è un metodo poco affidabile.

Riconoscimento caratteri con machine learning 

L’algoritmo OCR progettato da Hikvision si basa su una rete neurale di apprendimento automatico: è più preciso e affidabile rispetto ai sistemi di riconoscimento tradizionali, perché utilizza un modulo di identificazione dell’autenticità dei caratteri e supporta numeri e lettere di vari alfabeti (inglese, arabo, cinese, coreano, tailandese, giapponese ecc.).

Una tecnica per cinque continenti

Per risolvere il problema dell’universalità dell’al­goritmo di partizione dei caratteri, Hikvision ha sviluppato:

  • una tecnica avanzata (partizione approssi­mativa) che combina la proiezione verticale e la CCL per dividere approssimativamente i caratteri;
  • un metodo (partizione ad alta precisione) per separare con precisione i caratteri;
  • una strategia per identificare i bordi dei carat­teri nelle targhe multi-linea e multi-sezione.

Grazie a questo il software dell’azienda può es­sere applicato su qualsiasi targa nei cinque con­tinenti e non solo in mercati specifici.

Partizione approssimativa

Durante la procedura di partizione approssima­tiva, Hikvision utilizza innanzitutto la CCL per stimare la larghezza dei caratteri e degli spazi, poi adotta la proiezione verticale per individuare i caratteri e i loro bordi (sinistro e destro).

Partizione ad alta precisione

Poiché la partizione approssimativa può generare errori (come l’unione di due caratteri in uno solo oppure la divisione di un carattere in due), l’a­zienda ha sviluppato un algoritmo di partizione ad alta precisione, articolato nel seguente modo:

  • basandosi su diverse immagini pre-elaborate (a scala di grigio, disegni di contorno ecc.), l’algoritmo confronta i risultati e seleziona quello più attendibile;
  • un secondo algoritmo viene utilizzato per identificare i caratteri con larghezza differen­te; i caratteri risultato della partizione vengo­no evidenziati all’interno di un rettangolo blu;
  • per ovviare al problema per cui i caratteri si­mili vengono spesso considerati un solo carat­tere dopo la partizione approssimativa, la tec­nologia BAT (Block Analysis Technology, ossia analisi dei blocchi) partiziona ogni carattere migliorando l’affidabilità del riconoscimento.

Lettura targhe multi-linea e multi-sezione

Hikvision ha poi sviluppato una tecnica di ana­lisi delle targhe multi-campo e multi-riga non basata su schemi predefiniti, ma su algoritmi “di­namici” capaci di individuare il campo con meno caratteri (di norma ininfluenti) rispetto a quello con più caratteri (dati identificativi veri e propri) indipendentemente dal loro posizionamento.

 

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome