帯域幅は、ビデオ監視システムのイーサネット ネットワーキングの最も重要な要素です。 事前に慎重に計画を立てないと、ビデオ監視システムが帯域幅のボトルネックに陥る可能性があります。 これにより、ビデオ パケットの損失、遅延、ジッターが発生するだけでなく、ビデオの品質が低下したり、さらに悪いことに、重大なインシデントの記録が妨げられたりすることがあります。 帯域幅によって、特定の保存期間のストレージ容量要件も決まります。 ビデオ帯域幅を理解するには、いくつかの分野についての深い知識が必要です。 この技術ノートは、ビデオ監視システムのパフォーマンスに影響を与えるものについての基本的な知識を提供するためにインターンされています。

IP監視カメラの帯域幅

帯域幅とは何ですか?
IPビデオ カメラの画像、音声、制御データを含むデータ ストリームとして送信されます。 10 秒あたりに送信する必要があるデータの量は帯域幅と呼ばれます。 通常、Mbit/s 単位で測定されるため、イーサネット リンクのビットレート容量と簡単に比較できます。 たとえば、100 Mbit/s はイーサネット、1,000 Mbit/s はファスト イーサネット、1 Mbit/s はギガビット イーサネットと呼ばれます。 もう 8 つの測定単位は MByte/s で、8 バイトには XNUMX ビットがあるため、ビットレートの XNUMX/XNUMX に相当します。
1Mビット/秒 = 1,000キロビット/秒 = 125キロバイト/秒
1 ギガビット/秒 = 1,000 メガビット/秒 = 125 メガバイト/秒
1920 x 1080 HD 解像度のカメラは、1.49 FPS ビデオの生ビデオ データを 30 Gbit/s (1920 x 1080 x 24 x 30) でおおよそ生成します。 これは 178 MByte/s のデータであり、ビデオ圧縮が必要な理由です。
 
ビットとバイト
ビデオ監視システムでは、帯域幅は通常ビット単位で測定されますが、場合によってはバイト単位で測定されるため、混乱が生じます。 8 ビットは 1 バイトに等しいため、40 秒あたり 5 メガビットと言う人も XNUMX 秒あたり XNUMX メガバイトと言う人も同じ意味ですが、誤解や聞き間違いが起こりやすいです。

ビットとバイトは両方とも、短縮参照のために同じ文字を使用します。 唯一の違いは、ビットでは小文字の「b」が使用され、バイトでは大文字の「B」が使用されることです。 バイトはビットよりも「大きい」ということを思い出すと、これを思い出すことができます。 一見すると似ているため、これを混同する人がよくいます。 たとえば、100Kb/s と 100KB/s では、後者は前者の 8 倍です。
ビデオ監視システムの帯域幅を説明するときはビットを使用することをお勧めしますが、多くの場合サーバー/ストレージ側からバイトを使用する人もいることに注意してください。 このため、不明確な点がある場合は注意して確認を求めてください (つまり、「すみません、X ビットまたはバイトと言いましたね」など)。

キロビット、メガビット、 ギガビット
ビデオを送信するには多くのビット (またはバイト) が必要です。 実際には、ビデオ ストリームが 500b/s または 500B/s になることはありません。 ビデオには通常、少なくとも数千または数百万ビットが必要です。 集約されたビデオ ストリームには、多くの場合、数十億ビットが必要です。
大量の帯域幅を表す一般的な表現/プレフィックスは次のとおりです。

  • キロビットは千です。たとえば、500Kb/s は 500,000b/s に相当します。 キロビット単位の個々のビデオ ストリームは、低解像度、低フレーム、または高圧縮 (または上記のすべて) になる傾向があります。
  • メガビットは数百万です。たとえば、5Mb/s は 5,000,000b/s に相当します。 個々の IP カメラのビデオ ストリームは、1 桁のメガビットになる傾向があります (たとえば、2Mb/s、4Mb/s、または 10Mb/s がかなり一般的な範囲です)。 個々のビデオ ストリームで 4Mb/s を超えることはあまり一般的ではありませんが、超高解像度モデル (20K、30MP、100MP など) では不可能ではありません。 ただし、200 台のカメラを同時にストリーミングすると、通常は 300Mb/s または XNUMXMb/s などが必要になる場合があります。
  • ギガビットは数十億です。たとえば、5Gb/s は 5,000,000,000b/s に相当します。 すべてのビデオを中央サイトにバックホールする非常に大規模なビデオ監視システムがない限り、ビデオ監視にギガビットを超える帯域幅が必要になることはほとんどありません。

ビットレート

Ivideo 監視システム 帯域幅は車の速度のようなものです。 時間経過に伴う割合です。 したがって、時速 60 マイル (または時速 96 キロ) で運転していると言うのと同じように、カメラの帯域幅は 600 Kb/s、つまり 600 秒間に XNUMX キロビットが送信されたと言えます。

ビット レートは常に XNUMX 秒間のデータ (ビットまたはバイト) として表されます。 ネットワーク機器はデバイスが XNUMX 秒あたりに処理できる量として評価されるため、分単位または時間単位は適用されません。

ビデオ圧縮と帯域幅

ビデオ監視システムにおけるビデオ圧縮は、元のファイルよりも消費するスペースが少なく、ネットワーク/インターネット経由で送信しやすい方法でビデオ ファイルをエンコードするプロセスです。 これは、元のビデオ ファイルから冗長で機能しないデータを削除することでビデオ ファイル形式のサイズを削減する圧縮技術の一種です。

ビデオが圧縮されると、元の形式は (使用されているコーデックに応じて) 別の形式に変更されます。 ビデオ ファイルを再生するには、ビデオ プレーヤーがそのビデオ形式をサポートしているか、圧縮コーデックと統合されている必要があります。

モーションJPEG

モーション JPEG (M-JPEG または MJPEG) は、 ビデオ圧縮フォーマット それぞれの ビデオ フレーム or インターレース のフィールド デジタルビデオ シーケンスは 圧縮された として別々に JPEG 画像.

元々はマルチメディア PC アプリケーション用に開発された Motion JPEG は、幅広いクライアント サポートを享受しています。ほとんどの主要な Web ブラウザーとプレーヤーはネイティブ サポートを提供し、残りの場合はプラグインが利用可能です。 M-JPEG 標準を使用するソフトウェアとデバイスには、Web ブラウザ、メディア プレーヤー、ゲーム コンソール、デジタル カメラ、IP カメラ、Web カメラ、ストリーミング サーバー、ビデオ カメラ、ノンリニア ビデオ エディタなどが含まれます。

H.264

MPEG-264 AVC とも呼ばれる H.4 は、2003 年に導入された圧縮規格で、ビデオ監視システムのカメラや多くの商用メディア アプリケーションで使用される普及した規格です。 MJPEG のフレームごとのアプローチとは対照的に、H.264 はフルフレームをたとえば XNUMX 秒に XNUMX 回の間隔でのみ保存し、ビデオ内の動きによって生じる差分のみを使用して残りのフレームをエンコードします。 完全なフレームは I フレーム (インデックス フレームまたはイントラ フレームとも呼ばれます) と呼ばれ、前のフレームとの差分のみを含む部分的なフレームは P フレーム (予測フレームまたはフレーム間とも呼ばれます) と呼ばれます。 P フレームは I フレームよりも小さく、数が多くなります。 B フレーム (双方向フレーム) もあり、変更のために前後のフレームを双方向で参照します。 IPB フレームの繰り返しパターンは、グループ オブ ピクチャ (GOP) と呼ばれます。 I フレームの時間間隔はさまざまで、XNUMX 秒に複数回から XNUMX 分近くまでの範囲になります。 送信される I フレームが増えるほどビデオ ストリームは大きくなりますが、これは I フレームでのみ発生するため、ストリームのデコードの再開が容易になります。

H.265

H.265 および MPEG-H Part 2 とも呼ばれる高効率ビデオ コーディング (HEVC) は、広く使用されているアドバンスト ビデオ コーディング (AVC、H.264、または MPEG-4 Part 10) の後継として MPEG-H プロジェクトの一部として設計されたビデオ圧縮規格です。 AVC と比較して、HEVC は、同じレベルのビデオ品質で 25% ~ 50% 優れたデータ圧縮を実現するか、同じビット レートでビデオ品質を大幅に向上させます。 8192K UHD を含む最大 4320 × 8 の解像度をサポートし、主に 8 ビット AVC とは異なり、HEVC のより忠実度の高い Main 10 プロファイルは、サポートされているほぼすべてのハードウェアに組み込まれています。

H.264vsH.265 H.265 さまざまな理由により、H.264 よりも高度です。 ここでの最大の違いは、H.265/HEVC ではライブ ビデオ ストリームのファイル サイズをさらに小さくできることです。 これにより、必要な帯域幅が大幅に減少します。 そして、H.265 のもう 4 つの利点は、コーディング ツリー単位でデータを処理するという事実です。 マクロブロックのブロック サイズは 4×16 から 16×64 までですが、CTU は最大 64×265 ブロックを処理できます。 これにより、H.XNUMX は情報をより効率的に圧縮できるようになります。 さらに, H.265 では、H.264 よりも動き補償と空間予測が向上しています。 これは、すべての情報を解凍してストリームを視聴するために必要な帯域幅と処理能力が少なくて済むため、視聴者にとって非常に役立ちます。

固定および可変ビット レート (CBR および VBR)

ビットレートは、一定期間に転送されるデータの量を測定します。 オンライン ビデオ ストリーミングでは、ビデオ ビットレートはキロビット/秒 (kbps) で測定されます。 ビットレートはビデオの品質に影響します。 より高いビットレートでストリーミングすると、より高品質のストリームを生成できます。

4K映像監視システム

ビットレートは、ストリーミング プロセスのエンコードまたはトランスコード段階でもデータの転送を扱うため、この段階でも重要です。

固定ビットレート

カメラを CBR 用に設定する場合、カメラは一定の帯域幅を消費するように設定されます。 より多くの変更が発生するにつれて、適用される圧縮の量も増加します。 これにより、画像に圧縮アーチファクトが追加され、画質が低下する可能性があります。 CBR を使用すると、帯域幅の目標を満たすために画質が犠牲になります。 目標が適切に設定されている場合、この低下はほとんど目立たず、ストレージの計算とネットワークの計画に安定した基礎を与えます。 ネットワーク使用率が低いローカル エリア ネットワーク (LAN) に設置された IP 監視カメラの場合、またはストレージ容量が豊富な場合は、最高の画質を維持するために VBR をお勧めしますが、CBR は帯域幅が制限された環境の制御に役立ちます。

可変ビットレート

各圧縮方法の強さを調整できます。 一般に、圧縮率が高くなるとアーチファクトが多く発生するため、目的の動作を実現するにはさまざまな戦略が必要になります。 VBR 圧縮を使用する場合、一貫した画質を維持するために、圧縮ストリームのサイズを変更することができます。 したがって、シーンに動きがあり、それが一定ではない傾向がある場合には、VBR がより適している可能性があります。 欠点は、帯域幅が状況に応じてある程度変化する可能性があることです。 そのため、ストレージが計画よりも早く使い果たされたり、カメラが突然より多くの帯域幅を必要としたときに伝送ボトルネックが発生したりする可能性があります。 VBR では、ビットレートに定められた明確な上限はありません。 ユーザーは、特定の目標ビットレートまたは画質レベルを設定します。

一部のレコーダー システムでは、VBR 圧縮レベルを Extra High、High、Normal、Low、および Extra Low に設定できます。

IP監視カメラの帯域幅
 図 3 ビデオ品質超低、平均帯域幅は 0.5 Mbit/s
IPビデオ監視カメラの帯域幅
図 4 ビデオ品質は超高、平均帯域幅は 1.5 Mbit/s

カメラの帯域幅消費量

カメラの帯域幅消費の一般的な要因をいくつか示します。

解像度: 解像度が高くなるほど、帯域幅も広くなります。

フレームレート: フレーム レートが大きいほど、帯域幅も大きくなります

シーンの複雑さ: シーン内のアクティビティが多いほど (シーン内に人がいないのに対し、多くの車や人が移動している)、必要な帯域幅は大きくなります。

低光: 夜間は、カメラからのノイズにより多くの帯域幅が必要になりますが、常にではありません。

ビデオ解像度

ビデオ監視システムのすべてのカメラにはイメージ センサーが搭載されています。 左から右への利用可能なピクセルは水平解像度を提供し、上から下へのピクセルは垂直解像度を提供します。 XNUMX つの数値を乗算すると、このイメージ センサーの合計解像度が決まります。

ピクセルの RGB カラー値が 24 ビットであると仮定します。

1920(H) x 1080(V) = 2,073,600 ピクセル =2.0 MP x 24 ビット = 48 Mbit/s

4096(H) x 2160(V) = 8,847,360 ピクセル =8.0 MP x 24 ビット = 192 Mbit/s

したがって、4096 x 2160 にはより多くのピクセル、つまりより多くのデータが含まれるため、より多くの帯域幅が必要になります。 ただし、被写体、顔、車のモデルとその色、ナンバープレートを識別する必要がある場合には、より鮮明で鮮明な写真が得られます。 逆も同様で、解像度が低いと生成される帯域幅は少なくなりますが、その代わりに画像が不鮮明になり、ぼやけてしまいます。 通常、解像度が低いと、監視オペレーターは状況を認識し、詳細ではなく何が起こっているかを把握できます。

画像の鮮明さを決定するのは解像度だけではありません。 レンズの光学性能、焦点距離(光学ズーム)、被写体までの距離、照明条件、汚れ、天候も重要な要素です。

フレームレート

ビデオ監視システムのフレーム レートは、60 秒あたりのフレーム数 (FPS) で測定されます。これは、30 秒間に生成される画像の数を意味します。 フレーム レートが高いほど、ビデオ内の被写体の動きはより滑らかになります。 フレーム レートが低いほど、動きがぎくしゃくして、被写体が位置から位置へとジャンプし、その間のものが失われることになります。 帯域幅はフレーム レートとともに増加します。 ただし、エンコード効率が低下するため、フレーム レートを半分にしても、通常は帯域幅が完全に半分になるわけではありません。 最新の監視カメラは最大 5 FPS を生成できます。 ただし、解像度の設定が高すぎると、CPU の制限により FPS が低い値に制限される場合があります。 シーンに最適な FPS 設定を見つけることは、目的と帯域幅の考慮事項の間の妥協点です。フレーム間で重要な詳細が失われることなく、すべての関連情報をキャプチャすることです。 カメラが静かな全体像を監視している場合は、15 FPS まで上げる必要はありません。 XNUMX ~ XNUMX FPS の設定で十分です。 経験則として、より急速な変化が発生するほど、またはより速い被写体の動きが予想されるほど、FPS を高く設定する必要があります。 カメラの設置後に FPS を調整し、ビデオの滑らかさが許容できるかどうかを監視します。

シーンの複雑さ

シーンの複雑さは、ビデオ カメラが生成する帯域幅にも影響します。 一般に、シーンが複雑になればなるほど、特定の画質を達成するためにより多くの帯域幅が必要になります。 たとえば、木の葉、ワイヤーフェンス、またはポップコーンの天井などのランダムなテクスチャがあるシーンでは、シーンの複雑さが増します。 通常の単色で塗られた壁や小さなディテールなどは、単純なシーンとみなされます。 同様に、動きや動きも複雑さを増します。 通り過ぎる人、横切る車、風にそよぐ木の葉などがその例です。

ビデオ監視システム
図 5 複雑なシーン、ビデオ ビットレートは 5 Mbit/s

カメラとクライアントの数 カメラの数は、ビデオ監視システムの帯域幅要件に影響します。 すべてのカメラが同じである場合、カメラ番号が XNUMX 倍になると、生成されるデータも XNUMX 倍になります。 システムのスケーラビリティを維持するには、大規模なトポロジを管理可能な小さなパーティションに分割できなければなりません。 システムを階層化された分散アーキテクチャで構築することにより、広範囲の量にわたって拡張性を維持することができます。 重要なのは、ボトルネックを回避するために帯域幅を分散することです。 詳細については、「帯域幅のボトルネック」セクションで説明します。 閲覧クライアント数 上記の説明は、レコーダーに供給されるカメラの帯域幅に関するものです。 これは図の片側にすぎず、もう一方の側では、ライブまたはビデオの再生を視聴しているクライアントにレコーダーを接続しています。 たとえば、24 時間年中無休でカメラを常に監視するセキュリティ チームが存在する場合があります。 この帯域幅は、カメラからのすべてのデータに等しくなります。 再生の場合、ライブ ストリーミングに加えて使用すると、さらに多くの帯域幅が必要になります。 同時に多くのクライアントがシステムに接続する可能性があることを考慮すると、クライアント側のトラフィックが最大の懸念事項になる可能性があります。