Codificati per risparmiare

L’utilizzo dei codec e dei loro speciali algoritmi consente di ridurre fortemente le dimensioni originali (e quindi la banda occupata delle reti LAN e/o Wi-Fi ) dei flussi video, senza pregiudicare la qualità delle immagini.

I flussi video digita­li “nativi” generati dalle telecamere IP dei sistemi di video­sorveglianza e sicurezza (anti­furti, videocitofoni ecc.) occu­pano molti gigabyte di spazio su un supporto di memoria o centinaia di megabit di banda di una connessione LAN o Wi-Fi, un “fardello” che le risorse hardware di sistema non sono in grado di gestire, soprattutto se moltiplicato per ogni singolo dispositivo presente.

Lo stesso problema si presenta anche a valle, ovvero in fase di gestione da parte del registra­tore NVR o DVR quando deve archiviare i filmati, gestirli per ricerche e analisi video, trasmetterli in streaming per il controllo locale e da remoto.

Ridurre la risoluzione e il bitra­te di ogni singolo flusso video non è la soluzione, ma solo un compromesso perché riduce la qualità e il dettaglio delle im­magini, vanificando i benefici che si ottengono dalle teleca­mere in alta (Full HD) e altissi­ma (Ultra HD) definizione.

Esiste invece un metodo si­curo ed efficace per ridurre lo spazio e la banda senza compromettere la qualità vi­deo, derivato dal mondo in­formatico (lo zip dei file), dal broadcasting televisivo (tv digitale terrestre/satellitare, IPTV ecc.) e dall’home video (DVD, Blu-ray ecc.). Si tratta di utilizzare tecniche di compressione che riduco­no il “peso” del flusso video cercando di mantenere il più possibile inalterate le sue ca­ratteristiche principali (defini­zione in primis) e quindi la sua qualità originale.

Queste tecniche si basano su standard e algoritmi intel­ligenti chiamati codec, che COdificano il flusso video catturato dal sensore della telecamera per viaggiare più comodamente su cavo LAN o in modalità Wi-Fi e lo DECo­dificano su NVR, DVR, PC o smartphone al momento della registrazione, della visione ecc.

Un codec può ridurre fino a 20-30 volte le dimensioni di un flusso video garantendo un’elevata qualità d’immagine (spesso paragonabile a quella dell’originale) grazie a tecniche sofisticate e “intelligenti” che elaborano il contenuto delle scene ed eliminano le informa­zioni ridondanti, cioè inutili o poco significative. In questo modo non si perdono i dettagli chiave delle riprese, come, per esempio, i lineamen­ti del volto di una persona, la targa di un automezzo ecc.

Per svolgere questa operazio­ne, spesso molto delicata, si utilizzano metodi diversi che comportano anche differenti velocità (bitrate), qualità e la­tenze (ossia il tempo richiesto per comprimere, trasmettere, decomprimere e visualizzare il video). Alcuni codec elaborano le sin­gole immagini che, in sequen­za, compongono il video, men­tre altri si occupano dell’intero flusso video.

I codec video attualmente utilizzati nei sistemi di video sorveglianza e sicurezza sono talmente diffusi da garantire la massima compatibilità e interoperabilità possibili tra i vari elementi dell’impianto, anche appartenenti a brand e tipologie differenti.

I codec supportati da teleca­mere, videocitofoni, sensori di movimento con videoverifica e NVR sono principalmente quattro: Motion JPEG (MJPEG), MPEG-4, H.264 e H.265. Que­sti ultimi due sono disponibili anche in alcune varianti ideate dai market leader (per esempio, H.264+, H.265+, Smart H.265+) per migliorare ulteriormente l’efficienza e le prestazioni ri­spetto alle versioni standard. Esiste poi un nuovo codec chia­mato AV1, open e gratuito, con caratteristiche e potenzialità molto interessanti anche in ambito security.

codec
CODEC A CONFRONTO: Cosa caratterizza il processo di compressione dei codec, ordinati per efficienza

MJPEG - Semplice ed essenziale per i flussi video secondari

Motion JPEG è un formato di compressione di origine informatica che risale alla metà degli anni Novanta ma che viene utilizzato tuttora in DVR analogici (per lo streaming in uscita), telecamere e videocitofoni IP.

È il meno efficiente tra i codec video e quindi viene adottato principalmente per i flussi video secondari destinati a smartphone e tablet che si accontentano di una bassa risoluzione (320x240 pixel), banda e qualità delle immagini.

codec
L’efficienza di MJPEG è molto bassa rispetto a MPEG-4 e H.264 e, di conseguenza, il suo impiego è ormai limitato ai flussi video secondari e multipli, con bassa risoluzione, frame rate e bitrate

La sua prerogativa è quella di generare un flus­so video digitale partendo da una sequenza di immagini JPG, elaborate singolarmente rimuo­vendo le informazioni superflue che, non essendo percepite dall’occhio umano, non comportano un’evidente perdita di qualità.

Le singole im­magini JPG hanno la stessa qualità, che varia a seconda del livello di compressione, e non sono dipendenti tra loro, ovvero non è presente alcuna compressione tra fotogrammi (interframe).

La sequenza mantiene quindi la sua efficacia e utilità anche in caso di perdita di uno o più frame e rende più facile l’editing video grazie alla possi­bilità di effettuare tagli sul singolo fotogramma.

MPEG-4 - Il salto di qualità grazie alla predizione

MPEG-4 (standard MPEG-4 Parte 2), conosciuto anche con il termine MPEG-4 Visual, è uno dei codec più diffusi per le applicazioni video con­sumer e professionali.

L’idea alla base è la predizione interframe (quan­tizzazione), ovvero il primo fotogramma del vi­deo viene utilizzato come riferimento per quelli successivi, che formano un gruppo. Il codec ge­nera un primo set di informazioni per ricreare la prima immagine e un secondo set che compren­de solo le variazioni rispetto al primo set attra­verso una compensazione nella variazione del movimento (motion-compensated frames).

Nel caso di un videocitofono o di una telecamera di sorveglianza che riprende una persona (soggetto attivo) stazionaria o in movimento rispetto a uno sfondo (passivo), MPEG-4 codifica ogni sin­golo movimento del soggetto, che varia rispetto al tempo e allo spazio, e una sola volta lo sfondo, in quanto risulta stabile e invariato. Eliminando ogni informazione ridondante (come la codifica continua dello sfondo) si riduce sensibilmente la quantità dei dati di digitalizzazione, garantendo immagini significative e di qualità.

H.264 - Standard e profili ad alta efficienza

H.264 (MPEG-4 Part 10 o MPEG-4/AVC - Advanced Video Coding) non è un vero e proprio codec come i precedenti (che defi­niscono l’intera catena di codifica e deco­difica) ma, più precisamente, uno standard che definisce la sintassi del flusso dati e il metodo per decodificarlo. Appartiene a una famiglia (H.26x) composta da profili diversi.

Un dispositivo digitale può gestire uno o più profili ma non necessariamente tutti, a seconda del tipo di impiego, delle caratteristiche tecniche ecc. Lo standard H.264 viene solitamente utilizzato per la compressione video con perdita di quali­tà (in gergo tecnico “lossy”) ma supporta anche la compressione lossless (senza per­dita). Rappresenta l’evoluzione del codec MPEG-4 perché eredita lo stesso concetto di quantizzazione, rivisto e perfezionato per migliorare l’efficienza e la qualità video.

Ogni fotogramma viene suddiviso in una griglia di blocchi che possono contenere da un minimo di 16 (4x4) a un massimo di 256 pixel (16x16). Per ogni blocco (e non per ogni singola immagine come visto per il codec MPEG-4) viene ricercata una cor­rispondenza tra i fotogrammi precedenti o successivi allo stesso (motion compen­sation).

Se presente, i dati corrispondenti a questo blocco non vengono ritrasmessi ma viene semplicemente inviato un vettore che punta alla struttura corrispondente del fotogramma di riferimento, insieme ad al­cune informazioni per correggere eventuali differenze di struttura.

In assenza di cor­rispondenze adeguate, invece, l’algoritmo di compressione utilizza la struttura dei blocchi vicini nello stesso frame per predire la struttura e conservare la differenza tra quella prevista e quella effettiva. Semplifi­cando il concetto, il codec H.264 utilizza blocchi di compressione più piccoli in aree con molto movimento (Variable Block-Size Motion Compensation), per una segmenta­zione più precisa che si traduce in un mino­re consumo di banda e spazio di archivia­zione.

Pur adottando lo stesso principio di funzionamento del codec MPEG-4, H.264 risulta molto più complesso, ma anche più efficiente nel garantire immagini di ottima qualità a elevate compressioni. A grandi linee, permette una riduzione del 70-80% rispetto a MJPEG e del 40-50% rispetto a MPEG-4 a parità di qualità video.

codec
Lo smart codec H.264+, sviluppato da Hikvision, introduce svariate migliorie rispetto a H.264: encoding predittivo basato sullo sfondo, riduzione intelligente del rumore video e sistema di controllo del bitrate di lungo periodo

Essendo protetto da vari brevetti la cui licenza è amministrata da MPEG, l’utiliz­zo commerciale di H.264 richiede spesso il pagamento di royalties che incidono (seppur marginalmente) sul prezzo fina­le di telecamere, videocitofoni, NVR ecc.

Grazie al contributo di Hikvision è stato sviluppato anche lo smart codec H.264+, una variante di H.264 che introduce diverse migliorie: encoding predittivo basato sullo sfondo, riduzione intelligente del rumore video, sistema di controllo del bitrate di lungo periodo. Tutto questo contribuisce a ridurre ulteriormente la banda occupata, migliorare l’efficienza e la precisione delle immagini.

H.265 - Efficienza super, ma con licenze a pagamento

H.265 (chiamato anche HEVC, ossia High Effi­ciency Video Coding) è il più recente e sofisticato tra gli standard di compressione video, ormai largamente impiegato in ambito sicurezza, vi­deocomunicazione e broadcasting. Rispetto al predecessore H.264, ha la capacità di raddoppiare il rapporto di compressione dati (con un risparmio del 50%), migliorare la qualità video a parità di bitrate e supportare i formati ad altissima definizione come 4K e 8K.

Per ottenere questi risultati, i progettisti hanno raffinato ulteriormente l’algoritmo del codec H.264 sotto diversi aspetti: aumentando la densi­tà di pixel del blocco di codifica (da 16x16 a 64x64 pixel) così da sfruttare meglio la correlazione tra pixel vicini con segnali Ultra HD, utilizzando partizioni complesse (rettangolari e combinate) al posto dei precedenti macroblocchi, miglioran­do l’accuratezza delle tecniche di predizione tra i quadri nell’ambito dello stesso quadro, ottimiz­zando il sistema di trasmissione dei vettori in movimento all’interno del flusso video.

H.265 è strutturato per parallelizzare il proces­so di compressione (intraframe e interframe) e pertanto richiede un’elevata potenza di calcolo e sistemi hardware ad alte prestazioni. Inoltre, l’uso commerciale è subordinato al pagamento di royalties (come H.264). Anche H.265 è stato oggetto di ulteriori revisioni e affinamenti da parte dei big del mercato CCTV: due esempi sono H.265+, sviluppato da Hikvi­sion, e Smart H.265+, sviluppato da Dahua.

codec
Il codec Smart H.265+ di Dahua Technology si caratterizza per la regolazione differenziata del bitrate tra soggetto e sfondo

I vantaggi rispetto al codec standard sono no­tevoli: a seconda della luce ambientale (giorno/notte, che influisce sul rumore) e dell’affollamen­to della scena ripresa (interni/esterni), si può ridurre il bitrate medio da un minimo del 40% a un massimo del 98%.

Il lavoro per arrivare a queste prestazioni si è concentrato sugli stessi elementi chiave delle tecnologie H.264+/Smart H.264+, ovvero sugli algoritmi che regolano il bitrate in modo diversificato, sulla codifica video basata sull’analisi del contenuto delle immagini, sull’utilizzo di due fotogrammi di riferimento (Dual Frame) e sulla riduzione intelligente del rumore.

Inoltre, le versioni plus implementano differenti strategie di codifica basate sull’analisi della scena (luce, rumore, movimenti ecc.) chia­mate Dynamic ROI (area di interesse dinamica) e Dynamic GOP (gruppo di immagini dinamico). Anche per queste due varianti viene assicurato il pieno rispetto delle specifiche originali di H.265 e quindi la retrocompatibilità con i componenti che già lo supportano.

AV1 - Codec open source e gratuito

Il codec AV1 è stato introdotto nel 2018 da Al­liance for Open Media, un consorzio industriale statunitense no-profit che sviluppa tecnologie aperte e royalty-free (cioè gratuite e libere da vincoli commerciali) per la distribuzione multi­mediale, in risposta agli standard proprietari a pagamento (soggetti a licenze d'uso) come H.264 e H.265 di MPEG, Video Coding Experts Group e ITU-T.

Si tratta di un formato video flessibile, versatile e adattabile, progettato per l’implementazione ot­timizzata di hardware/software, che semplifica lo streaming video ad alte prestazioni su molti dispositivi in alternativa ai codec H.264 (ormai di vecchia generazione) e, soprattutto, H.265, grazie anche e soprattutto all’assenza di licenze.

È anche ideale per le applicazioni cloud (anche per le comunicazioni in tempo reale diretta­mente dai principali browser senza utilizzare programmi o plugin di terzi) e la sua presenza nei futuri dispositivi IP faciliterà l’integrazione e la distribuzione, semplificando le soluzioni di sicurezza di tipo ibrido.

Le prestazioni di AV1 sono spesso migliori ri­spetto a quelle di H.265 e di molto superiori a quelle di H.264, grazie a tecniche avanzate di codifica come la doppia predizione intraframe, la trasformazione adattiva, il filtraggio in loop, il controllo del tasso di errore e il super-reso­lution (codifica a bassa risoluzione e upscaling alla risoluzione nativa dopo la ricostruzione per ottimizzare lo streaming a basso bitrate).

A livello di funzionamento, il contenuto del fra­me video viene suddiviso in blocchi adiacenti delle stesse dimensioni chiamati “superblocchi”. Analogamente al concetto di macroblocco dei codec H.264/H.265, i superblocchi hanno forma quadrata, dimensioni di 128x128 o 64x64 pixel e possono essere suddivisi in blocchi più piccoli (per esempio, 4x4 pixel) secondo diversi schemi di partizionamento.

codec
Le prestazioni di AV1 sono spesso migliori rispetto a quelle di H.265 (HVEC), grazie a tecniche avanzate di codifica come la doppia predizione intra-frame, la trasformazione adattiva, il filtraggio in loop, il controllo del tasso di errore e il super-resolution (codifica a bassa risoluzione e upscaling alla risoluzione nativa dopo la ricostruzione per streaming a basso bitrate)

Con AV1 è possibile utilizzare due predizioni se­parate (con una precisione più elevata, di 10 o 12 bit) su parti spazialmente diverse di un blocco, utilizzando una linea di transizione obliqua e uniforme. Tutto questo consente una separa­zione più accurata degli oggetti senza le tradi­zionali linee a gradini lungo i confini dei blocchi quadrati, a tutto vantaggio della qualità delle immagini soprattutto nelle applicazioni critiche (come riconoscimento facciale, analisi AI ecc.).

Per quanto concerne il supporto da parte del mercato, AV1 viene già utilizzato dai principali browser e sistemi operativi per PC e mobile. Qua­si tutti i processori Intel, AMD e ARM supporta­no ormai da tempo la decodifica hardware acce­lerata VC1 e il prossimo step è quello di integrare il codec nei dispositivi di videosorveglianza.

A tal riguardo, Axis Communications ha annun­ciato che tutti i prodotti futuri con processore Artpec-9 (presentato di recente) includeranno il supporto AV1 (oltre a H.264 e H.265).

LASCIA UN COMMENTO

Inserisci il tuo commento
Inserisci il tuo nome