Ancho de banda del sistema de vigilancia IP

El ancho de banda es el elemento más importante de la red ethernet para los sistemas de videovigilancia. Sin una planificación cuidadosa con anticipación, los sistemas de videovigilancia podrían terminar con un cuello de botella en el ancho de banda. Esto no solo provoca la pérdida, el retraso o la inestabilidad de los paquetes de video, sino que también degrada la calidad del video o, lo que es peor, inhibe la grabación de incidentes críticos. El ancho de banda también determina los requisitos de capacidad de almacenamiento para un período de retención determinado. Comprender el ancho de banda de video requiere un conocimiento profundo de varios campos. Esta nota técnica está internada para proporcionar conocimientos fundamentales sobre lo que afecta el rendimiento de los sistemas de videovigilancia.

Ancho de banda de la cámara de vigilancia IP

¿Qué es el ancho de banda?
Video IP se transmite como un flujo de datos que contiene la imagen, el audio y los datos de control de la cámara. La cantidad de datos que deben enviarse por segundo se denomina ancho de banda. Normalmente se mide en Mbit/s, lo que facilita la comparación con la capacidad de tasa de bits de un enlace Ethernet. Por ejemplo, 10 Mbit/s se llama Ethernet, 100 Mbit/s es Fast Ethernet y 1,000 Mbit/s es Gigabit Ethernet. Otra unidad de medida es MByte/s, igual a 1/8 de la tasa de bits porque hay 8 bits en un byte.
1 Mbit/s = 1,000 Kbit/s = 125 Kbyte/s
1 Gbit/s = 1,000 Mbit/s = 125 Mbit/s
Una cámara con resolución HD de 1920 x 1080 genera aproximadamente datos de video sin procesar a 1.49 Gbit/s (30 x 1920 x 1080 x 24) para video de 30 FPS. Eso es 178 MByte/s de datos y la razón por la que se requiere compresión de video.
 
Bits y Bytes
En los sistemas de videovigilancia, el ancho de banda generalmente se mide en bits, pero a veces se mide en bytes, lo que genera confusión. 8 bits equivalen a 1 byte, por lo que alguien que dice 40 megabits por segundo y otra persona que dice 5 megabytes por segundo significan lo mismo, pero es fácil malinterpretarlo o escucharlo mal.

Bits y bytes usan la misma letra para referencia abreviada. La única diferencia es que los bits usan una 'b' minúscula y los bytes usan una 'B' mayúscula. Puede recordar esto recordando que los bytes son 'más grandes' que los bits. Vemos que la gente confunde esto a menudo porque a simple vista se ven similares. Por ejemplo, 100Kb/s y 100KB/s, este último es 8 veces mayor que el primero.
Le recomendamos que utilice bits cuando describa el ancho de banda del sistema de videovigilancia, pero tenga en cuenta que algunas personas, a menudo del lado del servidor/almacenamiento, utilizarán bytes. Debido a esto, esté alerta y pida confirmación si hay alguna falta de claridad (es decir, "Disculpe, dijo X bits o bytes").

kilobits, megabits y gigabits
Se necesitan muchos bits (o bytes) para enviar un video. En la práctica, nunca tendrá una transmisión de video de 500b/s o incluso 500B/s. El video generalmente necesita al menos miles o millones de bits. Las transmisiones de video agregadas a menudo necesitan miles de millones de bits.
Las expresiones/prefijos comunes para expresar una gran cantidad de ancho de banda son:

  • Kilobits son miles, por ejemplo, 500 Kb/s es igual a 500,000 XNUMX b/s. Un flujo de video individual en los kilobits tiende a ser de baja resolución o bajo marco o alta compresión (o todo lo anterior).
  • Megabits son millones, por ejemplo, 5Mb/s es igual a 5,000,000b/s. El flujo de video de una cámara IP individual tiende a estar en megabits de un solo dígito (por ejemplo, 1 Mb/s, 2 Mb/s o 4 Mb/s son rangos bastante comunes). Más de 10 Mb/s para una transmisión de video individual es menos común, aunque no imposible en modelos de súper alta resolución (4K, 20MP, 30MP, etc.). Sin embargo, 100 cámaras que se transmiten al mismo tiempo pueden requerir rutinariamente 200 Mb/s o 300 Mb/s, etc.
  • Gigabits es miles de millones, por ejemplo, 5 Gb/s es igual a 5,000,000,000b/s. Rara vez se necesita más de un gigabit de ancho de banda para la videovigilancia, a menos que se tenga un sistema de videovigilancia a gran escala que transmita todo el video a un sitio central.

Tasas de bits

Sistemas de videovigilancia El ancho de banda es como la velocidad de un vehículo. Es una tasa en el tiempo. Así como podría decir que estaba conduciendo a 60 mph (o 96 kph), podría decir que el ancho de banda de una cámara es de 600 Kb/s, es decir, que se transmitieron 600 kilobits en un segundo.

Las tasas de bits siempre se expresan como datos (bits o bytes) durante un segundo. Por minuto o por hora no se aplican, principalmente porque el equipo de red se clasifica según lo que el dispositivo puede manejar por segundo.

Compresión de video y ancho de banda

La compresión de video en los sistemas de videovigilancia es el proceso de codificación de un archivo de video de tal manera que consume menos espacio que el archivo original y es más fácil de transmitir a través de la red/Internet. Es un tipo de técnica de compresión que reduce el tamaño de los formatos de archivo de video al eliminar los datos redundantes y no funcionales del archivo de video original.

Una vez que se comprime un video, su formato original se cambia a un formato diferente (según el códec utilizado). El reproductor de video debe admitir ese formato de video o estar integrado con el códec de compresión para reproducir el archivo de video.

Motion JPEG

Motion JPEG (M-JPEG o MJPEG) es un formato de compresión de video en el que cada fotograma de vídeo or entrelazado campo de un video digital la secuencia es comprimido por separado como un JPEG imagen.

Motion JPEG, desarrollado originalmente para aplicaciones de PC multimedia, disfruta de una amplia compatibilidad con los clientes: la mayoría de los principales navegadores web y reproductores brindan compatibilidad nativa, y los complementos están disponibles para el resto. El software y los dispositivos que utilizan el estándar M-JPEG incluyen navegadores web, reproductores multimedia, consolas de juegos, cámaras digitales, cámaras IP, cámaras web, servidores de transmisión, cámaras de video y editores de video no lineales.

H.264

H.264, que también se denomina MPEG-4 AVC, es un estándar de compresión que se introdujo en 2003 y es el estándar predominante utilizado en cámaras de sistemas de videovigilancia y muchas aplicaciones de medios comerciales. A diferencia del enfoque cuadro por cuadro de MJPEG, H.264 almacena el cuadro completo solo a intervalos de, por ejemplo, una vez por segundo y codifica el resto de los cuadros solo con las diferencias causadas por el movimiento en el video. Los fotogramas completos se denominan fotograma I (también fotograma índice o intrafotograma) y los parciales que contienen solo la diferencia con el fotograma anterior se denominan fotograma P (también fotograma predicho o interfotograma). Los fotogramas P son más pequeños y más numerosos que los fotogramas I. También hay un cuadro B (cuadro bidireccional), que se refiere en ambos sentidos a los cuadros anteriores y posteriores para los cambios. El patrón recurrente de tramas IPB se denomina grupo de imágenes (GOP). El intervalo de tiempo para los fotogramas I varía y puede variar desde varias veces por segundo hasta casi un minuto. Cuantos más I-frames se transmitan, mayor será la transmisión de video, pero hace que reiniciar la decodificación de una transmisión sea más fácil, ya que esto solo puede suceder en un I-frame.

H.265

La codificación de video de alta eficiencia (HEVC), también conocida como H.265 y MPEG-H Parte 2, es un estándar de compresión de video diseñado como parte del proyecto MPEG-H como sucesor de la codificación avanzada de video ampliamente utilizada (AVC, H.264 o MPEG-4 Parte 10). En comparación con AVC, HEVC ofrece una compresión de datos entre un 25 % y un 50 % mejor con el mismo nivel de calidad de video o una calidad de video sustancialmente mejorada con la misma tasa de bits. Admite resoluciones de hasta 8192 × 4320, incluido 8K UHD y, a diferencia del AVC principalmente de 8 bits, el perfil Main 10 de mayor fidelidad de HEVC se ha incorporado en casi todo el hardware compatible.

H.264 frente a H.265 H.265 es más avanzado que H.264 por varias razones. La mayor diferencia aquí es que H.265/HEVC permite tamaños de archivo aún más bajos de sus transmisiones de video en vivo. Esto reduce significativamente el ancho de banda requerido. Luego, otra ventaja de H.265 es el hecho de que procesa datos en unidades de árbol de codificación. Aunque los macrobloques pueden ir desde tamaños de bloque de 4 × 4 a 16 × 16, las CTU pueden procesar hasta 64 × 64 bloques. Esto permite que H.265 comprima la información de manera más eficiente. Adicionalmente, H.265 también tiene una mejor compensación de movimiento y predicción espacial que H.264. Eso es bastante útil para sus espectadores, ya que sus dispositivos requerirán menos ancho de banda y potencia de procesamiento para descomprimir toda la información y ver una transmisión.

Tasas de bits constantes y variables (CBR y VBR)

La tasa de bits mide la cantidad de datos que se transfieren durante un período de tiempo. En la transmisión de video en línea, la tasa de bits de video se mide en kilobits por segundo o kbps. La tasa de bits afecta la calidad de un video. La transmisión con una tasa de bits más alta lo ayuda a producir transmisiones de mayor calidad.

Sistema de videovigilancia 4K

La tasa de bits también es algo importante en la etapa de codificación o transcodificación del proceso de transmisión, ya que esto también se ocupa de la transferencia de datos.

Velocidad de bits constante

Al configurar una cámara para CBR, la cámara está configurada para tener un consumo de ancho de banda constante. La cantidad de compresión aplicada aumenta a medida que se producen más cambios. Esto puede agregar artefactos de compresión a la imagen y degradar la calidad de la imagen. Con CBR, la calidad de la imagen se sacrificará para cumplir con el objetivo de ancho de banda. Si el objetivo se establece razonablemente, esta degradación puede apenas ser perceptible y brinda una base estable para calcular el almacenamiento y planificar la red. Para cámaras de vigilancia IP instaladas en una red de área local (LAN) con baja utilización de la red o cuando el espacio de almacenamiento es abundante, se recomienda VBR para mantener la mejor calidad de imagen, mientras que CBR puede ayudar a controlar entornos con ancho de banda restringido.

Tasa de bits variable

La fuerza de cada método de compresión se puede ajustar. En general, una mayor compresión provoca más artefactos, por lo que existen diferentes estrategias para lograr el comportamiento deseado. Cuando se utiliza la compresión VBR, se permite que el tamaño del flujo comprimido varíe para mantener una calidad de imagen constante. Por lo tanto, VBR puede ser más adecuado cuando hay movimiento en la escena y tiende a no ser constante. La desventaja es que el ancho de banda puede, hasta cierto punto, variar según la situación. Por lo tanto, el almacenamiento puede agotarse antes de lo planeado o pueden aparecer cuellos de botella en la transmisión cuando las cámaras repentinamente requieren más ancho de banda. En VBR, no se impone un límite firme a la tasa de bits. El usuario establece una determinada tasa de bits objetivo o nivel de calidad de imagen.

El nivel de compresión VBR se puede establecer en Extra Alto, Alto, Normal, Bajo y Extra Bajo en algunos sistemas de grabación.

Ancho de banda de la cámara de vigilancia IP
 Figura 3 Calidad de video Muy baja, el ancho de banda promedio es de 0.5 Mbit/s
Ancho de banda de la cámara de videovigilancia IP
Figura 4 Calidad de video Extra alta, el ancho de banda promedio es de 1.5 Mbit/s

Consumo de ancho de banda de la cámara

Aquí hay algunos factores comunes del consumo de ancho de banda de la cámara:

Resolución: A mayor resolución, mayor ancho de banda.

Cuadros por segundo: Cuanto mayor sea la velocidad de fotogramas, mayor será el ancho de banda

Complejidad de escena: Cuanta más actividad haya en la escena (muchos coches y gente moviéndose frente a nadie en la escena), mayor será el ancho de banda necesario.

poca luz: La noche a menudo, pero no siempre, requiere más ancho de banda debido al ruido de las cámaras.

Resolución de vídeo

Cada cámara en los sistemas de videovigilancia tiene un sensor de imagen. Los píxeles disponibles de izquierda a derecha proporcionan la resolución horizontal, mientras que los píxeles de arriba a abajo proporcionan la resolución vertical. Multiplique los dos números para obtener la resolución total de este sensor de imagen.

Suponiendo 24 bits para los valores de color RGB de un píxel:

1920(H) x 1080(V) = 2,073,600 2.0 24 píxeles = 48 MP x XNUMX bits = XNUMX Mbit/s

4096(H) x 2160(V) = 8,847,360 8.0 24 píxeles = 192 MP x XNUMX bits = XNUMX Mbit/s

Por lo tanto, 4096 x 2160 ocupa más ancho de banda ya que contiene más píxeles, o simplemente decir, más datos. Pero brinda imágenes más claras y nítidas cuando es necesario identificar un sujeto, una cara o un modelo de automóvil y su color o matrícula. Viceversa, una resolución más baja genera menos ancho de banda, pero la compensación es una imagen menos clara y borrosa. La resolución más baja generalmente les da a los operadores de vigilancia conciencia de la situación, viendo lo que está sucediendo en lugar de los detalles.

La resolución no es lo único que determina la claridad de una imagen. El rendimiento óptico de la lente, la distancia focal (zoom óptico), la distancia al objeto, las condiciones de iluminación, la suciedad y el clima también son factores críticos.

Cuadros por segundo

La velocidad de fotogramas en los sistemas de videovigilancia se mide en fotogramas por segundo (FPS), lo que significa la cantidad de imágenes que se producen en un segundo. Cuanto mayor sea la velocidad de fotogramas, más suave se moverá el sujeto en el vídeo. Cuanto menor sea la velocidad de fotogramas, más movimientos bruscos se vuelven hasta el punto en que los sujetos saltan de una posición a otra sin perder nada en el medio. El ancho de banda aumenta con la velocidad de fotogramas. Sin embargo, la mitad de la velocidad de fotogramas generalmente no reduce el ancho de banda a la mitad, porque la eficiencia de codificación se ve afectada. Las cámaras de vigilancia modernas pueden generar hasta 60 FPS. Sin embargo, las limitaciones de la CPU a veces restringen el FPS a un valor más bajo cuando las resoluciones son demasiado altas. Encontrar la configuración óptima de FPS para una escena es un compromiso entre los objetivos: capturar toda la información relevante sin que se pierdan detalles esenciales entre fotogramas y consideraciones de ancho de banda. Si una cámara está monitoreando una vista general tranquila, no hay necesidad de subir a 30 FPS. Una configuración de 5 a 15 FPS es suficiente. Como regla general, cuanto más rápido ocurra el cambio o cuanto más rápido se anticipe el movimiento del sujeto, mayor será el FPS que se debe configurar. Ajuste el FPS después de instalar las cámaras y controle si la fluidez del video es aceptable o no.

Complejidad de escena

La complejidad de una escena también afecta el ancho de banda que genera una cámara de video. Generalmente, cuanto más compleja es la escena, más ancho de banda se requerirá para lograr una determinada calidad de imagen. Por ejemplo, las escenas que tienen hojas de árboles, cercas de alambre o texturas aleatorias como techos de palomitas de maíz aumentan la complejidad de la escena. Otros, como una pared normal pintada de un solo color o un pequeño detalle, se consideran una escena simple. Del mismo modo, el movimiento o movimiento aumenta la complejidad. La gente que pasa caminando, los automóviles que cruzan o las hojas de los árboles en la brisa son ejemplos.

Sistemas de videovigilancia
Figura 5 Escena compleja, la tasa de bits de video es de 5 Mbit/s

Número de cámaras y clientes El número de cámaras influye en los requisitos de ancho de banda de los sistemas de videovigilancia. Si todas las cámaras son iguales, el doble de números de cámara duplicará los datos generados. Para mantener la escalabilidad de un sistema, debe poder dividir grandes topologías en particiones más pequeñas y manejables. Al estructurar el sistema en una arquitectura distribuida y en capas, es posible mantener la escalabilidad en una amplia gama de cantidades. La clave es distribuir el ancho de banda para evitar cuellos de botella. Se discutirá más en la sección Cuellos de botella de ancho de banda. Número de clientes que ven La discusión anterior se relaciona con el ancho de banda de la cámara que alimenta la grabadora. Este es solo un lado de la imagen, donde el otro lado está conectando las grabadoras a los clientes que ven videos en vivo o reproducidos. Por ejemplo, puede haber un equipo de seguridad que controle constantemente las cámaras las 24 horas del día, los siete días de la semana. Este ancho de banda sería igual a todos los datos provenientes de las cámaras. En el caso de la reproducción, se requiere aún más ancho de banda si se usa además de la transmisión en vivo. Teniendo en cuenta que puede haber muchos clientes que se conectan a un sistema al mismo tiempo, el tráfico del lado del cliente puede ser la preocupación dominante.