Bande passante du système de surveillance IP

La bande passante est l'élément le plus crucial de la mise en réseau Ethernet pour les systèmes de vidéosurveillance. Sans une planification minutieuse à l'avance, les systèmes de vidéosurveillance pourraient se retrouver avec un goulot d'étranglement de la bande passante. Cela entraîne non seulement une perte de paquets vidéo, un retard ou une gigue, mais dégrade également la qualité vidéo, ou pire encore, empêche l'enregistrement d'incidents critiques. La bande passante détermine également les besoins en capacité de stockage pour une période de rétention donnée. Comprendre la bande passante vidéo nécessite une connaissance approfondie de plusieurs domaines. Cette note technique est intégrée pour fournir des connaissances fondamentales sur ce qui affecte les performances des systèmes de vidéosurveillance.

Bande passante de la caméra de surveillance IP

Qu'est-ce que la bande passante?
vidéo IP est transmis sous la forme d'un flux de données contenant les données d'image, audio et de contrôle de la caméra. La quantité de données qui doit être envoyée par seconde est appelée bande passante. Il est couramment mesuré en Mbit/s, ce qui facilite la comparaison avec la capacité de débit d'une liaison Ethernet. Par exemple, 10 Mbit/s est appelé Ethernet, 100 Mbit/s est Fast Ethernet et 1,000 1 Mbit/s est Gigabit Ethernet. Une autre unité de mesure est le MByte/s, égal à 8/8 du débit car il y a XNUMX bits dans un octet.
1 Mbit/s = 1,000 125 Kbit/s = XNUMX Ko/s
1 Gbit/s = 1,000 125 Mbit/s = XNUMX Mo/s
Une caméra de résolution HD 1920 x 1080 génère approximativement des données vidéo brutes à 1.49 Gbit/s (30 x 1920 x 1080 x 24) pour une vidéo de 30 FPS. C'est 178 Mo/s de données et la raison pour laquelle la compression vidéo est nécessaire.
 
Bits et octets
Dans les systèmes de vidéosurveillance, la bande passante est généralement mesurée en bits mais parfois mesurée en octets, ce qui prête à confusion. 8 bits équivaut à 1 octet, donc quelqu'un qui dit 40 mégabits par seconde et une autre personne qui dit 5 mégaoctets par seconde signifient la même chose mais il est facile de mal comprendre ou de mal entendre.

Les bits et les octets utilisent tous deux la même lettre comme référence abrégée. La seule différence est que les bits utilisent un « b » minuscule et les octets utilisent un « B » majuscule. Vous pouvez vous en souvenir en rappelant que les octets sont "plus gros" que les bits. Nous voyons souvent les gens confondre cela parce qu'en un coup d'œil, ils se ressemblent. Par exemple, 100Kb/s et 100Ko/s, ce dernier est 8x supérieur au premier.
Nous vous recommandons d'utiliser des bits pour décrire la bande passante du système de vidéosurveillance, mais attention, certaines personnes, souvent du côté serveur/stockage, utiliseront des octets. Pour cette raison, soyez vigilant et demandez confirmation s'il y a un manque de clarté (c'est-à-dire « Désolé, vous avez dit X bits ou octets »).

Kilobits, Mégabits et Gigabits
Il faut beaucoup de bits (ou octets) pour envoyer une vidéo. En pratique, vous n'aurez jamais un flux vidéo de 500b/s ou même 500b/s. La vidéo nécessite généralement au moins des milliers ou des millions de bits. Les flux vidéo agrégés nécessitent souvent des milliards de bits.
Les expressions/préfixes courants pour exprimer une grande quantité de bande passante sont :

  • Les kilobits sont des milliers, par exemple, 500Kb/s est égal à 500,000 XNUMXb/s. Un flux vidéo individuel dans les kilobits a tendance à être soit à basse résolution, soit à faible trame, soit à haute compression (ou tout ce qui précède).
  • Les mégabits représentent des millions, par exemple, 5 Mb/s équivaut à 5,000,000 1 2 b/s. Un flux vidéo de caméra IP individuelle a tendance à être dans les mégabits à un chiffre (par exemple, 4Mb/s ou 10Mb/s ou 4Mb/s sont des plages assez courantes). Plus de 20 Mo/s pour un flux vidéo individuel est moins courant, mais pas impossible dans les modèles à très haute résolution (30K, 100MP, 200MP, etc.). Cependant, 300 caméras diffusées en même temps peuvent nécessiter XNUMX Mb/s ou XNUMX Mb/s, etc.
  • Les gigabits représentent des milliards, par exemple, 5 Gb/s équivaut à 5,000,000,000 XNUMX XNUMX XNUMX b/s. On a rarement besoin de plus d'un gigabit de bande passante pour la vidéosurveillance, sauf si l'on dispose d'un système de vidéosurveillance à très grande échelle qui achemine toutes les vidéos vers un site central.

Taux de bits

Systèmes de vidéosurveillance ILa bande passante est comme la vitesse du véhicule. C'est un rythme dans le temps. Donc, tout comme vous pourriez dire que vous roulez à 60 mph (ou 96 km/h), vous pourriez dire que la bande passante d'une caméra est de 600 Kb/s, c'est-à-dire que 600 kilobits ont été transmis en une seconde.

Les débits binaires sont toujours exprimés en données (bits ou octets) sur une seconde. La minute ou l'heure ne s'applique pas, principalement parce que l'équipement réseau est évalué en fonction de ce que l'appareil peut gérer par seconde.

Compression vidéo et bande passante

La compression vidéo dans les systèmes de vidéosurveillance est le processus d'encodage d'un fichier vidéo de telle sorte qu'il consomme moins d'espace que le fichier d'origine et qu'il soit plus facile à transmettre sur le réseau/Internet. Il s'agit d'un type de technique de compression qui réduit la taille des formats de fichiers vidéo en éliminant les données redondantes et non fonctionnelles du fichier vidéo d'origine.

Une fois qu'une vidéo est compressée, son format d'origine est changé en un format différent (selon le codec utilisé). Le lecteur vidéo doit prendre en charge ce format vidéo ou être intégré au codec de compression pour lire le fichier vidéo.

Motion JPEG

Motion JPEG (M-JPEG ou MJPEG) est un format de compression vidéo dans lequel chaque image vidéo or entrelacée domaine d'un vidéo numérique la séquence est comprimé séparément en tant que JPEG image.

Développé à l'origine pour les applications PC multimédia, Motion JPEG bénéficie d'une large prise en charge client : la plupart des principaux navigateurs et lecteurs Web offrent une prise en charge native, et des plug-ins sont disponibles pour le reste. Les logiciels et appareils utilisant la norme M-JPEG comprennent les navigateurs Web, les lecteurs multimédias, les consoles de jeux, les appareils photo numériques, les caméras IP, les webcams, les serveurs de streaming, les caméras vidéo et les éditeurs vidéo non linéaires

H.264

H.264, également appelé MPEG-4 AVC, est une norme de compression qui a été introduite en 2003 et qui est la norme la plus utilisée dans les caméras de système de vidéosurveillance et de nombreuses applications médiatiques commerciales. Contrairement à l'approche image par image de MJPEG, H.264 stocke l'image complète uniquement à des intervalles de, par exemple, une fois par seconde et encode le reste des images uniquement avec les différences causées par le mouvement dans la vidéo. Les images complètes sont appelées I-frame (également index frame ou intra-frame) et les partielles ne contenant que la différence par rapport à l'image précédente sont appelées P-frame (également prédites frame ou inter-frame). Les images P sont plus petites et plus nombreuses que les images I. Il existe également une trame B (trame bidirectionnelle), qui fait référence dans les deux sens aux trames précédentes et suivantes pour les modifications. Le motif récurrent des trames IPB est appelé un groupe d'images (GOP). L'intervalle de temps pour les images I varie et peut aller de plusieurs fois par seconde à près d'une minute. Plus il y a d'images I transmises, plus le flux vidéo sera volumineux, mais cela facilite le redémarrage du décodage d'un flux car cela ne peut se produire qu'au niveau d'une image I.

H.265

Le codage vidéo à haute efficacité (HEVC), également connu sous le nom de H.265 et MPEG-H Part 2, est une norme de compression vidéo conçue dans le cadre du projet MPEG-H en tant que successeur du codage vidéo avancé largement utilisé (AVC, H .264 ou MPEG-4 Partie 10). Par rapport à AVC, HEVC offre une compression des données de 25 % à 50 % supérieure au même niveau de qualité vidéo ou une qualité vidéo considérablement améliorée au même débit binaire. Il prend en charge des résolutions allant jusqu'à 8192 × 4320, y compris 8K UHD, et contrairement à l'AVC principalement 8 bits, le profil Main 10 haute fidélité de HEVC a été intégré à presque tous les matériels pris en charge.

H.264 contre H.265 H.265 est plus avancé que H.264 pour diverses raisons. La plus grande différence ici est que H.265/HEVC permet des tailles de fichiers encore plus faibles pour vos flux vidéo en direct. Cela réduit considérablement la bande passante requise. Ensuite, un autre avantage de H.265 est le fait qu'il traite les données dans des unités d'arbre de codage. Bien que les macroblocs puissent aller de 4 × 4 à 16 × 16 blocs, les CTU sont capables de traiter jusqu'à 64 × 64 blocs. Cela permet au H.265 de compresser les informations plus efficacement. En outre, H.265 a également une compensation de mouvement et une prédiction spatiale améliorées par rapport à H.264. Cela est très utile pour vos téléspectateurs dans la mesure où leurs appareils nécessiteront moins de bande passante et de puissance de traitement pour décompresser toutes les informations et regarder un flux.

Débits binaires constants et variables (CBR et VBR)

Le débit binaire mesure la quantité de données transférées sur une période de temps. Dans le streaming vidéo en ligne, le débit binaire vidéo est mesuré en kilobits par seconde, ou kbps. Le débit affecte la qualité d'une vidéo. Le streaming avec un débit binaire plus élevé vous aide à produire des flux de meilleure qualité.

Système de vidéosurveillance 4K

Le débit binaire est également quelque chose d'important dans l'étape d'encodage ou de transcodage du processus de diffusion en continu, car cela concerne également le transfert de données.

Débit constant

Lors de la configuration d'une caméra pour CBR, la caméra est configurée pour avoir une consommation de bande passante constante. La quantité de compression appliquée augmente à mesure que d'autres modifications se produisent. Cela peut ajouter des artefacts de compression à l'image et dégrader la qualité de l'image. Avec CBR, la qualité d'image sera sacrifiée pour atteindre l'objectif de bande passante. Si l'objectif est raisonnablement fixé, cette dégradation peut être à peine perceptible et elle donne une base stable pour calculer le stockage et planifier le réseau. Pour les caméras de surveillance IP installées dans un réseau local (LAN) avec une faible utilisation du réseau ou lorsque l'espace de stockage est abondant, VBR est recommandé pour maintenir la meilleure qualité d'image, tandis que CBR peut aider à contrôler les environnements à bande passante limitée.

Débit binaire variable

La force de chaque méthode de compression peut être ajustée. En général, une compression plus élevée provoque plus d'artefacts, il existe donc différentes stratégies pour obtenir le comportement souhaité. Lorsque la compression VBR est utilisée, la taille du flux compressé peut varier pour maintenir une qualité d'image constante. Ainsi, VBR peut être plus approprié lorsqu'il y a du mouvement dans la scène et qu'il a tendance à ne pas être constant. L'inconvénient est que la bande passante peut, dans une certaine mesure, varier en fonction de la situation. Ainsi, le stockage peut être utilisé plus tôt que prévu ou des goulots d'étranglement de transmission peuvent apparaître lorsque les caméras nécessitent soudainement plus de bande passante. Dans VBR, aucun plafond ferme n'est placé sur le débit binaire. L'utilisateur définit un certain débit cible ou niveau de qualité d'image.

Le niveau de compression VBR peut être réglé sur Extra High, High, Normal, Low et Extra Low dans certains systèmes d'enregistrement.

Bande passante de la caméra de surveillance IP
 Figure 3 Qualité vidéo Extra faible, la bande passante moyenne est de 0.5 Mbit/s
Bande passante de la caméra de surveillance vidéo IP
Figure 4 Qualité vidéo Extra High, la bande passante moyenne est de 1.5 Mbit/s

Consommation de bande passante de la caméra

Voici quelques facteurs courants de consommation de bande passante de la caméra :

Résolution: Plus la résolution est élevée, plus la bande passante est grande.

Fréquence d'images: Plus la fréquence d'images est élevée, plus la bande passante est grande

Complexité de la scène: Plus il y a d'activité dans la scène (beaucoup de voitures et de personnes se déplaçant contre personne dans la scène), plus la bande passante nécessaire est grande.

faible luminosité: La nuit nécessite souvent, mais pas toujours, plus de bande passante en raison du bruit des caméras.

Résolution du vidéo

Chaque caméra des systèmes de vidéosurveillance possède un capteur d'image. Les pixels disponibles de gauche à droite fournissent la résolution horizontale, tandis que les pixels de haut en bas fournissent la résolution verticale. Multipliez les deux nombres pour obtenir la résolution totale de ce capteur d'image.

En supposant 24 bits pour les valeurs de couleur RVB d'un pixel :

1920(H) x 1080(V) = 2,073,600 2.0 24 pixels = 48 MP x XNUMX bits = XNUMX Mbit/s

4096(H) x 2160(V) = 8,847,360 8.0 24 pixels = 192 MP x XNUMX bits = XNUMX Mbit/s

Par conséquent, 4096 x 2160 prend plus de bande passante car il contient plus de pixels, ou simplement dit, plus de données. Mais il donne des images plus claires et plus nettes lorsqu'il est nécessaire d'identifier un sujet, un visage ou un modèle de voiture et sa couleur ou sa plaque d'immatriculation. Inversement, une résolution plus faible génère moins de bande passante, mais le compromis est une image moins claire et plus floue. Une résolution plus faible donne généralement aux opérateurs de surveillance une connaissance de la situation, en voyant ce qui se passe plutôt que des détails.

La résolution n'est pas la seule chose qui détermine la clarté d'une image. Les performances optiques de l'objectif, la distance focale (zoom optique), la distance à l'objet, les conditions d'éclairage, la saleté et les conditions météorologiques sont également des facteurs critiques.

Fréquence d'images

La fréquence d'images dans les systèmes de vidéosurveillance est mesurée en images par seconde (FPS), ce qui signifie le nombre d'images produites en une seconde. Plus la fréquence d'images est élevée, plus le sujet se déplace de manière fluide dans la vidéo. Plus la fréquence d'images est faible, plus les mouvements sont saccadés jusqu'au point où les sujets sautent d'une position à l'autre avec une perte de tout ce qui se trouve entre les deux. La bande passante augmente avec la fréquence d'images. La moitié de la fréquence d'images ne réduit généralement pas la bande passante de moitié, car l'efficacité de l'encodage en souffre. Les caméras de surveillance modernes peuvent générer jusqu'à 60 FPS. Cependant, les limitations du processeur restreignent parfois le FPS à une valeur inférieure lorsque les résolutions sont trop élevées. Trouver le réglage FPS optimal pour une scène est un compromis entre les objectifs : capturer toutes les informations pertinentes sans que les détails essentiels ne soient perdus entre les images par rapport aux considérations de bande passante. Si une caméra surveille une vue d'ensemble silencieuse, il n'est pas nécessaire d'aller jusqu'à 30 FPS. Un réglage de 5 à 15 FPS est suffisant. En règle générale, plus le changement est rapide ou plus le mouvement du sujet est anticipé, plus le FPS doit être élevé. Ajustez le FPS après l'installation des caméras et vérifiez si la fluidité de la vidéo est acceptable ou non.

Complexité de la scène

La complexité d'une scène affecte également la bande passante générée par une caméra vidéo. Généralement, plus la scène est complexe, plus il faudra de bande passante pour obtenir une certaine qualité d'image. Par exemple, les scènes comportant des feuilles d'arbres, des grillages ou des textures aléatoires comme des plafonds en pop-corn augmentent la complexité de la scène. D'autres, comme un mur normal peint en couleur unie ou un petit détail, sont considérés comme une scène simple. De même, le mouvement ou le mouvement augmente la complexité. Les passants, les voitures qui traversent ou les feuilles des arbres dans la brise en sont des exemples.

Systèmes de vidéosurveillance
Figure 5 Scène complexe, le débit vidéo est de 5 Mbit/s

Nombre de caméras et de clients Le nombre de caméras influence les besoins en bande passante pour un système de vidéosurveillance. Si toutes les caméras sont identiques, deux fois les numéros de caméra doubleront les données générées. Pour maintenir l'évolutivité d'un système, il doit être capable de diviser de grandes topologies en partitions plus petites gérables. En structurant le système dans une architecture en couches et distribuée, il est possible de maintenir l'évolutivité sur une large gamme de quantités. La clé est de répartir la bande passante afin d'éviter les goulots d'étranglement. Nous en discuterons davantage dans la section Goulots d'étranglement de la bande passante. Nombre de clients spectateurs La discussion ci-dessus concerne la bande passante de la caméra qui alimente l'enregistreur. Ce n'est qu'un côté de l'image, où l'autre côté connecte les enregistreurs aux clients qui regardent la vidéo en direct ou en lecture. Par exemple, il peut y avoir une équipe de sécurité qui surveille en permanence les caméras 24 heures sur XNUMX, sept jours sur sept. Cette bande passante serait égale à toutes les données provenant des caméras. Dans le cas de la lecture, une bande passante encore plus importante est nécessaire si elle est utilisée en plus de la diffusion en direct. Considérant qu'il peut y avoir de nombreux clients se connectant à un système en même temps, le trafic côté client peut être la principale préoccupation.