Largura de banda do sistema de vigilância IP

A largura de banda é o elemento mais importante da rede ethernet para sistemas de vigilância por vídeo. Sem um planejamento cuidadoso com antecedência, os sistemas de vigilância por vídeo podem acabar com um gargalo de largura de banda. Isso não apenas causa perda de pacotes de vídeo, atraso ou instabilidade, mas também degrada a qualidade do vídeo ou, pior ainda, inibe a gravação de incidentes críticos. A largura de banda também determina os requisitos de capacidade de armazenamento para um determinado período de retenção. Compreender a largura de banda de vídeo exige um conhecimento profundo de vários campos. Esta nota técnica destina-se a fornecer conhecimento fundamental sobre o que afeta o desempenho dos sistemas de vigilância por vídeo.

Largura de banda da câmera de vigilância IP

O que é largura de banda?
vídeo IP é transmitido como um fluxo de dados que contém a imagem, o áudio e os dados de controle da câmera. A quantidade de dados que deve ser enviada por segundo é chamada de largura de banda. Geralmente é medido em Mbit/s, o que facilita a comparação com a capacidade de taxa de bits de um link Ethernet. Por exemplo, 10 Mbit/s é chamado de Ethernet, 100 Mbit/s é Fast Ethernet e 1,000 Mbit/s é Gigabit Ethernet. Outra unidade de medida é MByte/s, igual a 1/8 da taxa de bits porque há 8 bits em um byte.
1 Mbit/s = 1,000 Kbit/s = 125 Kbyte/s
1 Gbit/s = 1,000 Mbit/s = 125 Mbyte/s
Uma câmera com resolução HD de 1920 x 1080 gera aproximadamente dados de vídeo brutos a 1.49 Gbit/s (30 x 1920 x 1080 x 24) para vídeo de 30 FPS. São 178 MByte/s de dados e o motivo pelo qual a compactação de vídeo é necessária.
 
Bits e bytes
Em sistemas de vigilância por vídeo, a largura de banda normalmente é medida em bits, mas às vezes é medida em bytes, causando confusão. 8 bits é igual a 1 byte, então alguém dizendo 40 Megabits por segundo e outra pessoa dizendo 5 Megabytes por segundo significam a mesma coisa, mas é fácil entender ou ouvir mal.

Bits e bytes usam a mesma letra para referência abreviada. A única diferença é que os bits usam um 'b' minúsculo e os bytes usam um 'B' maiúsculo. Você pode se lembrar disso lembrando que os bytes são 'maiores' que os bits. Vemos que as pessoas confundem isso com frequência porque, à primeira vista, parecem semelhantes. Por exemplo, 100Kb/s e 100KB/s, este último é 8x maior que o primeiro.
Recomendamos que você use bits ao descrever a largura de banda do sistema de vigilância por vídeo, mas esteja ciente de que algumas pessoas, geralmente do lado do servidor/armazenamento, usarão bytes. Por causa disso, fique alerta e peça confirmação se houver alguma falta de clareza (ou seja, “Desculpe, você disse X bits ou bytes”).

Kilobits, Megabits e gigabits
São necessários muitos bits (ou bytes) para enviar um vídeo. Na prática, você nunca terá um stream de vídeo de 500b/s ou mesmo de 500b/s. O vídeo geralmente precisa de pelo menos milhares ou milhões de bits. Fluxos de vídeo agregados geralmente precisam de bilhões de bits.
As expressões/prefixos comuns para expressar uma grande quantidade de largura de banda são:

  • Kilobits são milhares, por exemplo, 500Kb/s é igual a 500,000b/s. Um fluxo de vídeo individual em kilobits tende a ser de baixa resolução ou baixo quadro ou alta compactação (ou todos os itens acima).
  • Megabits são milhões, por exemplo, 5Mb/s é igual a 5,000,000b/s. O fluxo de vídeo de uma câmera IP individual tende a estar em megabits de um dígito (por exemplo, 1Mb/s ou 2Mb/s ou 4Mb/s são intervalos bastante comuns). Mais de 10Mb/s para um stream de vídeo individual é menos comum, embora não seja impossível em modelos de super alta resolução (4K, 20MP, 30MP, etc.). No entanto, 100 câmeras sendo transmitidas ao mesmo tempo podem exigir rotineiramente 200 Mb/s ou 300 Mb/s, etc.
  • Gigabits é bilhões, por exemplo, 5 Gb/s é igual a 5,000,000,000 b/s. Raramente é necessário mais do que um gigabit de largura de banda para vigilância por vídeo, a menos que se tenha um sistema de vigilância por vídeo de grande escala que transmita todo o vídeo para um local central.

Taxas de bits

Sistemas de vigilância Ivideo A largura de banda é como a velocidade do veículo. É uma taxa ao longo do tempo. Assim como você pode dizer que está dirigindo a 60 mph (ou 96 km/h), você pode dizer que a largura de banda de uma câmera é 600 Kb/s, ou seja, 600 kilobits foram transmitidos em um segundo.

As taxas de bits são sempre expressas como dados (bits ou bytes) em um segundo. Por minuto ou hora não são aplicáveis, principalmente porque o equipamento de rede é classificado como o que o dispositivo pode suportar por segundo.

Compressão de vídeo e largura de banda

A compressão de vídeo em sistemas de vigilância por vídeo é o processo de codificação de um arquivo de vídeo de forma que ocupe menos espaço que o arquivo original e seja mais fácil de transmitir pela rede/Internet. É um tipo de técnica de compactação que reduz o tamanho dos formatos de arquivo de vídeo, eliminando dados redundantes e não funcionais do arquivo de vídeo original.

Depois que um vídeo é compactado, seu formato original é alterado para um formato diferente (dependendo do codec usado). O reprodutor de vídeo deve oferecer suporte a esse formato de vídeo ou estar integrado ao codec de compactação para reproduzir o arquivo de vídeo.

Motion JPEG

Motion JPEG (M-JPEG ou MJPEG) é um Formato de compressão de vídeo em que cada quadro de vídeo or entrelaçado campo de um vídeo digital sequência é comprimido separadamente como um JPEG imagem.

Originalmente desenvolvido para aplicativos multimídia de PC, o Motion JPEG possui amplo suporte ao cliente: a maioria dos principais navegadores e players da Web oferece suporte nativo e plug-ins estão disponíveis para o restante. Software e dispositivos que usam o padrão M-JPEG incluem navegadores da web, reprodutores de mídia, consoles de jogos, câmeras digitais, câmeras IP, webcams, servidores de streaming, câmeras de vídeo e editores de vídeo não lineares

H.264

H.264, também chamado de MPEG-4 AVC, é um padrão de compactação introduzido em 2003 e é o padrão predominante usado em câmeras de sistema de vigilância por vídeo e em muitos aplicativos de mídia comercial. Em contraste com a abordagem quadro a quadro do MJPEG, o H.264 armazena o quadro completo apenas em intervalos de, por exemplo, uma vez por segundo e codifica o restante dos quadros apenas com as diferenças causadas pelo movimento no vídeo. Os quadros completos são chamados de quadros I (também quadros de índice ou intraquadros) e os parciais contendo apenas a diferença para o quadro anterior são chamados de quadros P (também quadros preditos ou interquadros). Os quadros P são menores e mais numerosos que os quadros I. Há também um quadro B (quadro bidirecional), que se refere em ambos os sentidos aos quadros anteriores e subsequentes para alterações. O padrão recorrente de quadros IPB é chamado de grupo de imagens (GOP). O intervalo de tempo para I-frames varia e pode variar de várias vezes por segundo até quase um minuto. Quanto mais quadros I forem transmitidos, maior será o fluxo de vídeo, mas torna mais fácil reiniciar a decodificação de um fluxo, pois isso só pode acontecer em um quadro I.

H.265

A Codificação de Vídeo de Alta Eficiência (HEVC), também conhecida como H.265 e MPEG-H Parte 2, é um padrão de compressão de vídeo projetado como parte do projeto MPEG-H como sucessor da amplamente utilizada Codificação de Vídeo Avançada (AVC, H .264 ou MPEG-4 Parte 10). Em comparação com o AVC, o HEVC oferece compactação de dados de 25% a 50% melhor no mesmo nível de qualidade de vídeo ou qualidade de vídeo substancialmente melhorada na mesma taxa de bits. Ele suporta resoluções de até 8192 × 4320, incluindo 8K UHD e, ao contrário do AVC principalmente de 8 bits, o perfil Main 10 de maior fidelidade do HEVC foi incorporado a quase todos os hardwares de suporte.

H.264vsH.265 H.265 é mais avançado que o H.264 por vários motivos. A maior diferença aqui é que H.265/HEVC permite tamanhos de arquivo ainda menores de seus streams de vídeo ao vivo. Isso reduz significativamente a largura de banda necessária. Então, outra vantagem do H.265 é o fato de que ele processa dados em unidades de árvore de codificação. Embora os macroblocos possam ir de 4 × 4 a 16 × 16 tamanhos de bloco, as CTUs são capazes de processar até 64 × 64 blocos. Isso permite que o H.265 comprima as informações com mais eficiência. Adicionalmente, o H.265 também possui uma compensação de movimento e previsão espacial melhorada do que o H.264. Isso é bastante útil para seus espectadores, pois seus dispositivos exigirão menos largura de banda e poder de processamento para descompactar todas as informações e assistir a um fluxo.

Taxas de bits constantes e variáveis ​​(CBR e VBR)

A taxa de bits mede a quantidade de dados que são transferidos durante um período de tempo. No streaming de vídeo online, a taxa de bits do vídeo é medida em kilobits por segundo, ou kbps. A taxa de bits afeta a qualidade de um vídeo. A transmissão com taxa de bits mais alta ajuda você a produzir transmissões de maior qualidade.

Sistema de vigilância por vídeo 4K

A taxa de bits também é algo importante no estágio de codificação ou transcodificação do processo de streaming, pois também lida com a transferência de dados.

Taxa de bits constante

Ao configurar uma câmera para CBR, a câmera é configurada para ter consumo de largura de banda constante. A quantidade de compactação aplicada aumenta à medida que ocorrem mais alterações. Isso pode adicionar artefatos de compactação à imagem e degradar a qualidade da imagem. Com CBR, a qualidade da imagem será sacrificada para atender à meta de largura de banda. Se o destino for razoavelmente definido, essa degradação pode ser quase imperceptível e fornece uma base estável para calcular o armazenamento e planejar a rede. Para câmeras de vigilância IP instaladas em uma rede local (LAN) com baixa utilização de rede ou quando o espaço de armazenamento é abundante, o VBR é recomendado para manter a melhor qualidade de imagem, enquanto o CBR pode ajudar a controlar ambientes com restrição de largura de banda.

Taxa de bits variável

A força de cada método de compressão pode ser ajustada. Em geral, maior compressão causa mais artefatos, então existem diferentes estratégias para alcançar o comportamento desejado. Quando a compactação VBR é usada, o tamanho do fluxo compactado pode variar para manter a qualidade da imagem consistente. Assim, o VBR pode ser mais adequado quando há movimento na cena e tende a não ser constante. A desvantagem é que a largura de banda pode, até certo ponto, variar dependendo da situação. Portanto, o armazenamento pode ser usado antes do planejado ou gargalos de transmissão podem aparecer quando as câmeras repentinamente exigirem mais largura de banda. No VBR, não há limite firme sendo colocado na taxa de bits. O usuário define uma determinada taxa de bits alvo ou nível de qualidade de imagem.

O nível de compressão VBR pode ser definido como Extra Alto, Alto, Normal, Baixo e Extra Baixo em alguns sistemas de gravador.

Largura de banda da câmera de vigilância IP
 Figura 3 Qualidade de vídeo extra baixa, largura de banda média de 0.5 Mbit/s
Largura de banda da câmera de vigilância por vídeo IP
Figura 4 Qualidade de vídeo Extra alta, largura de banda média de 1.5 Mbit/s

Consumo de largura de banda da câmera

Aqui estão alguns drivers comuns de consumo de largura de banda da câmera:

Resolução: Quanto maior a resolução, maior a largura de banda.

Taxa de quadros: Quanto maior a taxa de quadros, maior a largura de banda

Complexidade da cena: Quanto mais atividade na cena (muitos carros e pessoas se movendo vs ninguém na cena), maior a largura de banda necessária.

pouca luz: Muitas vezes, mas nem sempre, a noite requer mais largura de banda devido ao ruído das câmeras.

Resolução de vídeo

Cada câmera em sistemas de vigilância por vídeo possui um sensor de imagem. Os pixels disponíveis da esquerda para a direita fornecem a resolução horizontal, enquanto os pixels de cima para baixo fornecem a resolução vertical. Multiplique os dois números pela resolução total deste sensor de imagem.

Assumindo 24 bits para os valores de cor RGB de um pixel:

1920(H) x 1080(V) = 2,073,600 pixels =2.0 MP x 24 bits = 48 Mbit/s

4096(H) x 2160(V) = 8,847,360 pixels =8.0 MP x 24 bits = 192 Mbit/s

Portanto, 4096 x 2160 ocupa mais largura de banda, pois contém mais pixels, ou simplesmente, mais dados. Mas oferece imagens mais claras e nítidas quando necessário para identificar um assunto, um rosto ou um modelo de carro e sua cor ou placa. Vice-versa, uma resolução mais baixa gera menos largura de banda, mas a compensação é uma imagem menos nítida e desfocada. A resolução mais baixa geralmente dá aos operadores de vigilância consciência situacional - vendo o que está acontecendo em vez de detalhes.

A resolução não é a única coisa que determina a clareza de uma imagem. O desempenho óptico da lente, distância focal (zoom óptico), distância até o objeto, condições de iluminação, sujeira e clima também são fatores críticos.

Taxa de quadros

A taxa de quadros em sistemas de vigilância por vídeo é medida em quadros por segundo (FPS), o que significa o número de imagens produzidas em um segundo. Quanto maior a taxa de quadros, mais suave o assunto se move no vídeo. Quanto menor a taxa de quadros, mais movimentos bruscos se tornam até o ponto em que os assuntos saltam de uma posição para outra com a perda de qualquer coisa intermediária. A largura de banda aumenta com a taxa de quadros. Metade da taxa de quadros geralmente não reduz a largura de banda pela metade, porque a eficiência da codificação é prejudicada. As câmeras de vigilância modernas podem gerar até 60 FPS. No entanto, as limitações da CPU às vezes restringem o FPS a um valor mais baixo quando as resoluções são definidas muito altas. Encontrar a configuração de FPS ideal para uma cena é um compromisso entre os objetivos: capturar todas as informações relevantes sem que detalhes essenciais sejam perdidos entre os quadros versus considerações de largura de banda. Se uma câmera estiver monitorando uma visão geral silenciosa, não há necessidade de subir para 30 FPS. Uma configuração de 5 a 15 FPS é suficiente. Como regra geral, quanto mais rápida a mudança ocorrer ou quanto mais rápido o movimento do assunto for antecipado, mais alto o FPS deve ser definido. Ajuste o FPS após a instalação das câmeras e monitore se a suavidade do vídeo é aceitável ou não.

Complexidade da cena

A complexidade de uma cena também afeta a largura de banda gerada por uma câmera de vídeo. Geralmente, quanto mais complexa for a cena, mais largura de banda será necessária para obter uma determinada qualidade de imagem. Por exemplo, cenas com folhas de árvores, cercas de arame ou texturas aleatórias como tetos de pipoca aumentam a complexidade da cena. Outras, como uma parede normal, pintada de cor lisa ou com poucos detalhes, são consideradas uma cena simples. Da mesma forma, movimento ou movimento aumenta a complexidade. Pessoas passando, carros passando ou folhas de árvores ao vento são exemplos.

Sistemas de vigilância por vídeo
Figura 5 Cena complexa, taxa de bits de vídeo é de 5 Mbit/s

Número de câmeras e clientes O número de câmeras influencia os requisitos de largura de banda para sistemas de vigilância por vídeo. Se todas as câmeras forem iguais, o dobro dos números das câmeras dobrará os dados gerados. Para manter a escalabilidade de um sistema, ele deve ser capaz de dividir grandes topologias em partições menores gerenciáveis. Ao estruturar o sistema em uma arquitetura distribuída e em camadas, é possível manter a escalabilidade em uma grande variedade de quantidades. A chave é distribuir a largura de banda para evitar gargalos. Mais informações serão discutidas na seção Gargalos de largura de banda. Número de clientes visualizadores A discussão acima refere-se à alimentação da largura de banda da câmera no gravador. Este é apenas um lado da imagem, onde o outro lado está conectando os gravadores aos clientes assistindo ao vivo ou reproduzindo vídeo. Por exemplo, pode haver uma equipe de segurança que monitora constantemente as câmeras 24 horas por dia, sete dias por semana. Essa largura de banda seria igual a todos os dados vindos das câmeras. No caso da reprodução, ainda mais largura de banda é necessária se usada além da transmissão ao vivo. Considerando que pode haver muitos clientes se conectando a um sistema ao mesmo tempo, o tráfego do lado do cliente pode ser a preocupação dominante.