L’utilizzo dei codec e dei loro speciali algoritmi consente di ridurre fortemente le dimensioni originali (e quindi la banda occupata delle reti LAN e/o Wi-Fi ) dei flussi video, senza pregiudicare la qualità delle immagini.
I flussi video digitali “nativi” generati dalle telecamere IP dei sistemi di videosorveglianza e sicurezza (antifurti, videocitofoni ecc.) occupano molti gigabyte di spazio su un supporto di memoria o centinaia di megabit di banda di una connessione LAN o Wi-Fi, un “fardello” che le risorse hardware di sistema non sono in grado di gestire, soprattutto se moltiplicato per ogni singolo dispositivo presente.
Lo stesso problema si presenta anche a valle, ovvero in fase di gestione da parte del registratore NVR o DVR quando deve archiviare i filmati, gestirli per ricerche e analisi video, trasmetterli in streaming per il controllo locale e da remoto.
Ridurre la risoluzione e il bitrate di ogni singolo flusso video non è la soluzione, ma solo un compromesso perché riduce la qualità e il dettaglio delle immagini, vanificando i benefici che si ottengono dalle telecamere in alta (Full HD) e altissima (Ultra HD) definizione.
Esiste invece un metodo sicuro ed efficace per ridurre lo spazio e la banda senza compromettere la qualità video, derivato dal mondo informatico (lo zip dei file), dal broadcasting televisivo (tv digitale terrestre/satellitare, IPTV ecc.) e dall’home video (DVD, Blu-ray ecc.). Si tratta di utilizzare tecniche di compressione che riducono il “peso” del flusso video cercando di mantenere il più possibile inalterate le sue caratteristiche principali (definizione in primis) e quindi la sua qualità originale.
Queste tecniche si basano su standard e algoritmi intelligenti chiamati codec, che COdificano il flusso video catturato dal sensore della telecamera per viaggiare più comodamente su cavo LAN o in modalità Wi-Fi e lo DECodificano su NVR, DVR, PC o smartphone al momento della registrazione, della visione ecc.
Un codec può ridurre fino a 20-30 volte le dimensioni di un flusso video garantendo un’elevata qualità d’immagine (spesso paragonabile a quella dell’originale) grazie a tecniche sofisticate e “intelligenti” che elaborano il contenuto delle scene ed eliminano le informazioni ridondanti, cioè inutili o poco significative. In questo modo non si perdono i dettagli chiave delle riprese, come, per esempio, i lineamenti del volto di una persona, la targa di un automezzo ecc.
Per svolgere questa operazione, spesso molto delicata, si utilizzano metodi diversi che comportano anche differenti velocità (bitrate), qualità e latenze (ossia il tempo richiesto per comprimere, trasmettere, decomprimere e visualizzare il video). Alcuni codec elaborano le singole immagini che, in sequenza, compongono il video, mentre altri si occupano dell’intero flusso video.
I codec video attualmente utilizzati nei sistemi di video sorveglianza e sicurezza sono talmente diffusi da garantire la massima compatibilità e interoperabilità possibili tra i vari elementi dell’impianto, anche appartenenti a brand e tipologie differenti.
I codec supportati da telecamere, videocitofoni, sensori di movimento con videoverifica e NVR sono principalmente quattro: Motion JPEG (MJPEG), MPEG-4, H.264 e H.265. Questi ultimi due sono disponibili anche in alcune varianti ideate dai market leader (per esempio, H.264+, H.265+, Smart H.265+) per migliorare ulteriormente l’efficienza e le prestazioni rispetto alle versioni standard. Esiste poi un nuovo codec chiamato AV1, open e gratuito, con caratteristiche e potenzialità molto interessanti anche in ambito security.

MJPEG - Semplice ed essenziale per i flussi video secondari
Motion JPEG è un formato di compressione di origine informatica che risale alla metà degli anni Novanta ma che viene utilizzato tuttora in DVR analogici (per lo streaming in uscita), telecamere e videocitofoni IP.
È il meno efficiente tra i codec video e quindi viene adottato principalmente per i flussi video secondari destinati a smartphone e tablet che si accontentano di una bassa risoluzione (320x240 pixel), banda e qualità delle immagini.

La sua prerogativa è quella di generare un flusso video digitale partendo da una sequenza di immagini JPG, elaborate singolarmente rimuovendo le informazioni superflue che, non essendo percepite dall’occhio umano, non comportano un’evidente perdita di qualità.
Le singole immagini JPG hanno la stessa qualità, che varia a seconda del livello di compressione, e non sono dipendenti tra loro, ovvero non è presente alcuna compressione tra fotogrammi (interframe).
La sequenza mantiene quindi la sua efficacia e utilità anche in caso di perdita di uno o più frame e rende più facile l’editing video grazie alla possibilità di effettuare tagli sul singolo fotogramma.
MPEG-4 - Il salto di qualità grazie alla predizione
MPEG-4 (standard MPEG-4 Parte 2), conosciuto anche con il termine MPEG-4 Visual, è uno dei codec più diffusi per le applicazioni video consumer e professionali.
L’idea alla base è la predizione interframe (quantizzazione), ovvero il primo fotogramma del video viene utilizzato come riferimento per quelli successivi, che formano un gruppo. Il codec genera un primo set di informazioni per ricreare la prima immagine e un secondo set che comprende solo le variazioni rispetto al primo set attraverso una compensazione nella variazione del movimento (motion-compensated frames).
Nel caso di un videocitofono o di una telecamera di sorveglianza che riprende una persona (soggetto attivo) stazionaria o in movimento rispetto a uno sfondo (passivo), MPEG-4 codifica ogni singolo movimento del soggetto, che varia rispetto al tempo e allo spazio, e una sola volta lo sfondo, in quanto risulta stabile e invariato. Eliminando ogni informazione ridondante (come la codifica continua dello sfondo) si riduce sensibilmente la quantità dei dati di digitalizzazione, garantendo immagini significative e di qualità.
H.264 - Standard e profili ad alta efficienza
H.264 (MPEG-4 Part 10 o MPEG-4/AVC - Advanced Video Coding) non è un vero e proprio codec come i precedenti (che definiscono l’intera catena di codifica e decodifica) ma, più precisamente, uno standard che definisce la sintassi del flusso dati e il metodo per decodificarlo. Appartiene a una famiglia (H.26x) composta da profili diversi.
Un dispositivo digitale può gestire uno o più profili ma non necessariamente tutti, a seconda del tipo di impiego, delle caratteristiche tecniche ecc. Lo standard H.264 viene solitamente utilizzato per la compressione video con perdita di qualità (in gergo tecnico “lossy”) ma supporta anche la compressione lossless (senza perdita). Rappresenta l’evoluzione del codec MPEG-4 perché eredita lo stesso concetto di quantizzazione, rivisto e perfezionato per migliorare l’efficienza e la qualità video.
Ogni fotogramma viene suddiviso in una griglia di blocchi che possono contenere da un minimo di 16 (4x4) a un massimo di 256 pixel (16x16). Per ogni blocco (e non per ogni singola immagine come visto per il codec MPEG-4) viene ricercata una corrispondenza tra i fotogrammi precedenti o successivi allo stesso (motion compensation).
Se presente, i dati corrispondenti a questo blocco non vengono ritrasmessi ma viene semplicemente inviato un vettore che punta alla struttura corrispondente del fotogramma di riferimento, insieme ad alcune informazioni per correggere eventuali differenze di struttura.
In assenza di corrispondenze adeguate, invece, l’algoritmo di compressione utilizza la struttura dei blocchi vicini nello stesso frame per predire la struttura e conservare la differenza tra quella prevista e quella effettiva. Semplificando il concetto, il codec H.264 utilizza blocchi di compressione più piccoli in aree con molto movimento (Variable Block-Size Motion Compensation), per una segmentazione più precisa che si traduce in un minore consumo di banda e spazio di archiviazione.
Pur adottando lo stesso principio di funzionamento del codec MPEG-4, H.264 risulta molto più complesso, ma anche più efficiente nel garantire immagini di ottima qualità a elevate compressioni. A grandi linee, permette una riduzione del 70-80% rispetto a MJPEG e del 40-50% rispetto a MPEG-4 a parità di qualità video.

Essendo protetto da vari brevetti la cui licenza è amministrata da MPEG, l’utilizzo commerciale di H.264 richiede spesso il pagamento di royalties che incidono (seppur marginalmente) sul prezzo finale di telecamere, videocitofoni, NVR ecc.
Grazie al contributo di Hikvision è stato sviluppato anche lo smart codec H.264+, una variante di H.264 che introduce diverse migliorie: encoding predittivo basato sullo sfondo, riduzione intelligente del rumore video, sistema di controllo del bitrate di lungo periodo. Tutto questo contribuisce a ridurre ulteriormente la banda occupata, migliorare l’efficienza e la precisione delle immagini.
H.265 - Efficienza super, ma con licenze a pagamento
H.265 (chiamato anche HEVC, ossia High Efficiency Video Coding) è il più recente e sofisticato tra gli standard di compressione video, ormai largamente impiegato in ambito sicurezza, videocomunicazione e broadcasting. Rispetto al predecessore H.264, ha la capacità di raddoppiare il rapporto di compressione dati (con un risparmio del 50%), migliorare la qualità video a parità di bitrate e supportare i formati ad altissima definizione come 4K e 8K.
Per ottenere questi risultati, i progettisti hanno raffinato ulteriormente l’algoritmo del codec H.264 sotto diversi aspetti: aumentando la densità di pixel del blocco di codifica (da 16x16 a 64x64 pixel) così da sfruttare meglio la correlazione tra pixel vicini con segnali Ultra HD, utilizzando partizioni complesse (rettangolari e combinate) al posto dei precedenti macroblocchi, migliorando l’accuratezza delle tecniche di predizione tra i quadri nell’ambito dello stesso quadro, ottimizzando il sistema di trasmissione dei vettori in movimento all’interno del flusso video.
H.265 è strutturato per parallelizzare il processo di compressione (intraframe e interframe) e pertanto richiede un’elevata potenza di calcolo e sistemi hardware ad alte prestazioni. Inoltre, l’uso commerciale è subordinato al pagamento di royalties (come H.264). Anche H.265 è stato oggetto di ulteriori revisioni e affinamenti da parte dei big del mercato CCTV: due esempi sono H.265+, sviluppato da Hikvision, e Smart H.265+, sviluppato da Dahua.

I vantaggi rispetto al codec standard sono notevoli: a seconda della luce ambientale (giorno/notte, che influisce sul rumore) e dell’affollamento della scena ripresa (interni/esterni), si può ridurre il bitrate medio da un minimo del 40% a un massimo del 98%.
Il lavoro per arrivare a queste prestazioni si è concentrato sugli stessi elementi chiave delle tecnologie H.264+/Smart H.264+, ovvero sugli algoritmi che regolano il bitrate in modo diversificato, sulla codifica video basata sull’analisi del contenuto delle immagini, sull’utilizzo di due fotogrammi di riferimento (Dual Frame) e sulla riduzione intelligente del rumore.
Inoltre, le versioni plus implementano differenti strategie di codifica basate sull’analisi della scena (luce, rumore, movimenti ecc.) chiamate Dynamic ROI (area di interesse dinamica) e Dynamic GOP (gruppo di immagini dinamico). Anche per queste due varianti viene assicurato il pieno rispetto delle specifiche originali di H.265 e quindi la retrocompatibilità con i componenti che già lo supportano.
AV1 - Codec open source e gratuito
Il codec AV1 è stato introdotto nel 2018 da Alliance for Open Media, un consorzio industriale statunitense no-profit che sviluppa tecnologie aperte e royalty-free (cioè gratuite e libere da vincoli commerciali) per la distribuzione multimediale, in risposta agli standard proprietari a pagamento (soggetti a licenze d'uso) come H.264 e H.265 di MPEG, Video Coding Experts Group e ITU-T.
Si tratta di un formato video flessibile, versatile e adattabile, progettato per l’implementazione ottimizzata di hardware/software, che semplifica lo streaming video ad alte prestazioni su molti dispositivi in alternativa ai codec H.264 (ormai di vecchia generazione) e, soprattutto, H.265, grazie anche e soprattutto all’assenza di licenze.
È anche ideale per le applicazioni cloud (anche per le comunicazioni in tempo reale direttamente dai principali browser senza utilizzare programmi o plugin di terzi) e la sua presenza nei futuri dispositivi IP faciliterà l’integrazione e la distribuzione, semplificando le soluzioni di sicurezza di tipo ibrido.
Le prestazioni di AV1 sono spesso migliori rispetto a quelle di H.265 e di molto superiori a quelle di H.264, grazie a tecniche avanzate di codifica come la doppia predizione intraframe, la trasformazione adattiva, il filtraggio in loop, il controllo del tasso di errore e il super-resolution (codifica a bassa risoluzione e upscaling alla risoluzione nativa dopo la ricostruzione per ottimizzare lo streaming a basso bitrate).
A livello di funzionamento, il contenuto del frame video viene suddiviso in blocchi adiacenti delle stesse dimensioni chiamati “superblocchi”. Analogamente al concetto di macroblocco dei codec H.264/H.265, i superblocchi hanno forma quadrata, dimensioni di 128x128 o 64x64 pixel e possono essere suddivisi in blocchi più piccoli (per esempio, 4x4 pixel) secondo diversi schemi di partizionamento.

Con AV1 è possibile utilizzare due predizioni separate (con una precisione più elevata, di 10 o 12 bit) su parti spazialmente diverse di un blocco, utilizzando una linea di transizione obliqua e uniforme. Tutto questo consente una separazione più accurata degli oggetti senza le tradizionali linee a gradini lungo i confini dei blocchi quadrati, a tutto vantaggio della qualità delle immagini soprattutto nelle applicazioni critiche (come riconoscimento facciale, analisi AI ecc.).
Per quanto concerne il supporto da parte del mercato, AV1 viene già utilizzato dai principali browser e sistemi operativi per PC e mobile. Quasi tutti i processori Intel, AMD e ARM supportano ormai da tempo la decodifica hardware accelerata VC1 e il prossimo step è quello di integrare il codec nei dispositivi di videosorveglianza.
A tal riguardo, Axis Communications ha annunciato che tutti i prodotti futuri con processore Artpec-9 (presentato di recente) includeranno il supporto AV1 (oltre a H.264 e H.265).



