Băng thông là yếu tố quan trọng nhất của mạng ethernet cho các hệ thống giám sát video. Nếu không lập kế hoạch cẩn thận trước, các hệ thống giám sát video có thể bị tắc nghẽn băng thông. Điều này không chỉ gây ra tình trạng mất gói video, trễ hoặc giật hình mà còn làm giảm chất lượng video hoặc thậm chí tệ hơn là cản trở việc ghi lại các sự cố quan trọng. Băng thông cũng xác định các yêu cầu về dung lượng lưu trữ trong một khoảng thời gian lưu giữ nhất định. Hiểu băng thông video cần có kiến ​​thức chuyên sâu về một số lĩnh vực. Ghi chú kỹ thuật này được thực hiện để cung cấp kiến ​​thức cơ bản về những gì ảnh hưởng đến hiệu suất của hệ thống giám sát video.

Băng thông camera giám sát IP

Băng thông là gì?
video IP được truyền dưới dạng luồng dữ liệu chứa hình ảnh, âm thanh và dữ liệu điều khiển của camera. Lượng dữ liệu phải được gửi mỗi giây được gọi là băng thông. Nó thường được đo bằng Mbit/s, giúp dễ dàng so sánh với dung lượng tốc độ bit của liên kết Ethernet. Ví dụ: 10 Mbit/s được gọi là Ethernet, 100 Mbit/s là Fast Ethernet và 1,000 Mbit/s là Gigabit Ethernet. Một đơn vị đo lường khác là MByte/s, bằng 1/8 tốc độ bit vì có 8 bit trong một byte.
1 Mbit/s = 1,000 Kbit/s = 125 Kbyte/s
1 Gbit/s = 1,000 Mbit/s = 125 Mbyte/s
Máy ảnh có độ phân giải HD 1920 x 1080 tạo ra dữ liệu video thô ở tốc độ 1.49 Gbit/s (30 x 1920 x 1080 x 24) cho video 30 FPS. Đó là 178 MByte/s dữ liệu và lý do cần phải nén video.
 
Bit và byte
Trong các hệ thống giám sát video, băng thông thường được đo bằng bit nhưng đôi khi được đo bằng byte, gây nhầm lẫn. 8 bit bằng 1 byte nên có người nói 40 Megabit/giây, có người nói 5 Megabyte/giây nghĩa là giống nhau nhưng rất dễ hiểu nhầm hoặc nghe nhầm.

Cả bit và byte đều sử dụng cùng một chữ cái để tham khảo tốc ký. Sự khác biệt duy nhất là các bit sử dụng chữ thường 'b' và byte sử dụng chữ hoa 'B'. Bạn có thể nhớ điều này bằng cách nhắc lại rằng byte 'lớn hơn' so với bit. Chúng tôi thấy mọi người thường nhầm lẫn điều này bởi vì thoạt nhìn chúng trông giống nhau. Ví dụ: 100Kb/giây và 100KB/giây, tốc độ sau lớn hơn 8 lần so với tốc độ trước.
Chúng tôi khuyên bạn nên sử dụng bit khi mô tả băng thông hệ thống giám sát video nhưng lưu ý rằng một số người, thường từ phía máy chủ/bộ lưu trữ, sẽ sử dụng byte. Do đó, hãy cảnh giác và yêu cầu xác nhận nếu có bất kỳ điều gì không rõ ràng (ví dụ: “Xin lỗi, bạn đã nói X bit hoặc byte”).

Kilobit, Megabit và gigabit
Phải mất rất nhiều bit (hoặc byte) để gửi video. Trên thực tế, bạn sẽ không bao giờ có luồng video 500b/s hoặc thậm chí 500B/s. Video thường cần ít nhất hàng nghìn hoặc hàng triệu bit. Các luồng video tổng hợp thường cần hàng tỷ bit.
Biểu thức/tiền tố phổ biến để biểu thị một lượng lớn băng thông là:

  • Kilobit là hàng nghìn, ví dụ: 500Kb/s bằng 500,000b/s. Một luồng video riêng lẻ tính bằng kilobit có xu hướng có độ phân giải thấp hoặc khung hình thấp hoặc độ nén cao (hoặc tất cả các yếu tố trên).
  • Megabits là hàng triệu, ví dụ: 5Mb/s bằng 5,000,000b/s. Luồng video camera IP riêng lẻ có xu hướng ở dạng megabit một chữ số (ví dụ: 1Mb/s hoặc 2Mb/s hoặc 4Mb/s là các phạm vi khá phổ biến). Hơn 10Mb/giây cho một luồng video riêng lẻ ít phổ biến hơn, mặc dù không phải là không thể xảy ra ở các kiểu máy có độ phân giải siêu cao (4K, 20MP, 30MP, v.v.). Tuy nhiên, 100 camera được truyền phát cùng lúc có thể thường xuyên yêu cầu tốc độ 200Mb/giây hoặc 300Mb/giây, v.v.
  • Gigabits là hàng tỷ, ví dụ: 5Gb/s bằng 5,000,000,000b/s. Một người hiếm khi cần nhiều hơn một gigabit băng thông để giám sát video trừ khi người đó có một hệ thống giám sát video quy mô rất lớn truyền ngược tất cả video về một địa điểm trung tâm.

Tỷ giá bit

Hệ thống giám sát ivideo Băng thông giống như tốc độ xe. Đó là một tỷ lệ theo thời gian. Vì vậy, giống như bạn có thể nói rằng bạn đang lái xe với tốc độ 60 dặm/giờ (hoặc 96 km/h), bạn có thể nói băng thông của máy ảnh là 600Kb/giây, tức là 600 kilobit được truyền trong một giây.

Tốc độ bit luôn được biểu thị dưới dạng dữ liệu (bit hoặc byte) trong một giây. Mỗi phút hoặc giờ không được áp dụng, chủ yếu là do thiết bị mạng được đánh giá là những gì thiết bị có thể xử lý mỗi giây.

Nén video và băng thông

Nén video trong các hệ thống giám sát bằng video là quá trình mã hóa tệp video sao cho tiêu tốn ít dung lượng hơn so với tệp gốc và dễ truyền qua mạng/Internet hơn. Đây là một loại kỹ thuật nén giúp giảm kích thước của các định dạng tệp video bằng cách loại bỏ dữ liệu dư thừa và không có chức năng khỏi tệp video gốc.

Sau khi video được nén, định dạng ban đầu của nó sẽ được thay đổi thành một định dạng khác (tùy thuộc vào codec được sử dụng). Trình phát video phải hỗ trợ định dạng video đó hoặc được tích hợp với codec nén để phát tệp video.

JPEG chuyển động

Motion JPEG (M-JPEG hoặc MJPEG) là một Định dạng nén video trong đó mỗi khung video or xen kẽ lĩnh vực của một Video kĩ thuật số trình tự là nén riêng biệt như một JPEG hình ảnh.

Ban đầu được phát triển cho các ứng dụng máy tính đa phương tiện, Motion JPEG được hỗ trợ nhiều ứng dụng khách: hầu hết các trình duyệt web và trình phát chính đều cung cấp hỗ trợ riêng và phần bổ sung có sẵn cho phần còn lại. Phần mềm và thiết bị sử dụng tiêu chuẩn M-JPEG bao gồm trình duyệt web, trình phát đa phương tiện, bảng điều khiển trò chơi, máy ảnh kỹ thuật số, camera IP, webcam, máy chủ phát trực tuyến, máy quay video và trình chỉnh sửa video phi tuyến tính

H. 264

H.264, còn được gọi là MPEG-4 AVC, là một tiêu chuẩn nén được giới thiệu vào năm 2003 và là tiêu chuẩn phổ biến được sử dụng trong các camera của hệ thống giám sát video và nhiều ứng dụng truyền thông thương mại. Trái ngược với cách tiếp cận từng khung hình của MJPEG, H.264 chỉ lưu trữ toàn bộ khung hình trong các khoảng thời gian, chẳng hạn như một giây một lần và chỉ mã hóa phần còn lại của khung hình với sự khác biệt do chuyển động trong video gây ra. Các khung hình đầy đủ được gọi là khung hình I (cũng là khung chỉ mục hoặc khung nội bộ) và các khung hình một phần chỉ chứa sự khác biệt so với khung hình trước đó được gọi là khung hình P (còn gọi là khung hình dự đoán hoặc khung hình liên kết). P-frame nhỏ hơn và nhiều hơn so với I-frame. Ngoài ra còn có khung B (khung hai chiều), tham chiếu cả hai cách tới các khung trước và sau để thay đổi. Mẫu định kỳ của các khung IPB được gọi là một nhóm ảnh (GOP). Khoảng thời gian cho các khung hình I khác nhau và có thể nằm trong khoảng từ nhiều lần trong một giây đến gần một phút. Càng nhiều khung hình I được truyền đi, luồng video sẽ càng lớn, nhưng nó giúp việc giải mã lại luồng trở nên dễ dàng hơn vì điều này chỉ có thể xảy ra ở một khung hình I.

H.265

Mã hóa video hiệu quả cao (HEVC), còn được gọi là H.265 và MPEG-H Phần 2, là một tiêu chuẩn nén video được thiết kế như một phần của dự án MPEG-H với vai trò kế thừa Mã hóa video nâng cao được sử dụng rộng rãi (AVC, H.264 hoặc MPEG-4 Phần 10). So với AVC, HEVC cung cấp khả năng nén dữ liệu tốt hơn từ 25% đến 50% ở cùng mức chất lượng video hoặc chất lượng video được cải thiện đáng kể ở cùng tốc độ bit. Nó hỗ trợ độ phân giải lên tới 8192×4320, bao gồm 8K UHD và không giống như AVC 8 bit chủ yếu, cấu hình Main 10 có độ trung thực cao hơn của HEVC đã được tích hợp vào gần như tất cả phần cứng hỗ trợ.

H.264vsH.265 H.265 tiên tiến hơn H.264 vì nhiều lý do. Sự khác biệt lớn nhất ở đây là H.265/HEVC cho phép các luồng video trực tiếp của bạn có kích thước tệp thậm chí còn thấp hơn. Điều này làm giảm đáng kể băng thông cần thiết. Sau đó, một ưu điểm khác của H.265 là nó xử lý dữ liệu trong các đơn vị cây mã hóa. Mặc dù các macroblock có thể có kích thước khối từ 4×4 đến 16×16, nhưng CTU có thể xử lý tới 64×64 khối. Điều này cho phép H.265 nén thông tin hiệu quả hơn. Ngoài ra, H.265 cũng có khả năng dự đoán không gian và bù chuyển động được cải thiện hơn so với H.264. Điều đó khá hữu ích cho người xem của bạn vì thiết bị của họ sẽ yêu cầu ít băng thông và sức mạnh xử lý hơn để giải nén tất cả thông tin và xem luồng.

Tốc độ bit không đổi và biến đổi (CBR và VBR)

Tốc độ bit đo lượng dữ liệu được truyền trong một khoảng thời gian. Trong truyền phát video trực tuyến, tốc độ bit của video được đo bằng kilobit trên giây hoặc kbps. Tốc độ bit ảnh hưởng đến chất lượng của video. Phát trực tuyến với tốc độ bit cao hơn giúp bạn tạo ra các luồng chất lượng cao hơn.

Hệ thống giám sát video 4K

Tốc độ bit cũng là một yếu tố quan trọng trong giai đoạn mã hóa hoặc chuyển mã của quá trình phát trực tuyến vì điều này cũng liên quan đến việc truyền dữ liệu.

Tốc độ không đổi

Khi định cấu hình camera cho CBR, camera được đặt ở mức tiêu thụ băng thông không đổi. Lượng nén được áp dụng tăng lên khi có nhiều thay đổi hơn. Điều này có thể thêm các vật phẩm nén vào hình ảnh và làm giảm chất lượng hình ảnh. Với CBR, chất lượng hình ảnh sẽ được hy sinh để đáp ứng mục tiêu băng thông. Nếu mục tiêu được đặt hợp lý, sự xuống cấp này có thể hầu như không đáng chú ý và nó tạo cơ sở ổn định để tính toán lưu trữ và lập kế hoạch mạng. Đối với các camera giám sát IP được cài đặt trong mạng cục bộ (LAN) với mức sử dụng mạng thấp hoặc khi có nhiều dung lượng lưu trữ, VBR được khuyến nghị để duy trì chất lượng hình ảnh tốt nhất, trong khi CBR có thể giúp kiểm soát các môi trường bị hạn chế băng thông.

Tốc độ bit thay đổi

Cường độ của từng phương pháp nén có thể được điều chỉnh. Nói chung, độ nén cao hơn gây ra nhiều vật phẩm giả hơn, do đó, có các chiến lược khác nhau để đạt được hành vi mong muốn. Khi nén VBR được sử dụng, kích thước của luồng nén được phép thay đổi để duy trì chất lượng hình ảnh nhất quán. Do đó, VBR có thể phù hợp hơn khi có chuyển động trong cảnh và nó có xu hướng không đổi. Nhược điểm là băng thông có thể, ở một mức độ nhất định, thay đổi tùy theo tình huống. Vì vậy, dung lượng lưu trữ có thể được sử dụng sớm hơn dự kiến ​​hoặc tắc nghẽn đường truyền có thể xuất hiện khi camera đột nhiên yêu cầu thêm băng thông. Trong VBR, không có giới hạn cố định nào được đặt trên tốc độ bit. Người dùng đặt một mức chất lượng hình ảnh hoặc tốc độ bit mục tiêu nhất định.

Mức nén VBR có thể được đặt thành Cực cao, Cao, Bình thường, Thấp và Cực thấp trong một số hệ thống ghi.

Băng thông camera giám sát IP
 Hình 3 Chất lượng video Cực thấp, băng thông trung bình là 0.5 Mbit/s
Băng thông camera giám sát video IP
Hình 4 Chất lượng video Cực cao, băng thông trung bình là 1.5 Mbit/s

Tiêu thụ băng thông máy ảnh

Dưới đây là một vài trình điều khiển phổ biến của mức tiêu thụ băng thông camera:

Độ phân giải: Độ phân giải càng lớn thì băng thông càng lớn.

Frame Rate: Tốc độ khung hình càng lớn, băng thông càng lớn

Cảnh phức tạp: Cảnh càng có nhiều hoạt động (nhiều ô tô và người di chuyển so với không có ai trong cảnh), băng thông cần thiết càng lớn.

Ánh sáng yếu: Ban đêm thường xuyên, nhưng không phải lúc nào cũng cần nhiều băng thông hơn do tiếng ồn từ camera.

Độ phân giải

Mọi camera trong hệ thống giám sát video đều có cảm biến hình ảnh. Các pixel khả dụng từ trái sang phải cung cấp độ phân giải theo chiều ngang, trong khi các pixel từ trên xuống dưới cung cấp độ phân giải theo chiều dọc. Nhân hai số này để có tổng độ phân giải của cảm biến hình ảnh này.

Giả sử 24 bit cho các giá trị màu RGB của pixel:

1920(H) x 1080(V) = 2,073,600 pixel =2.0 MP x 24 bit = 48 Mbit/s

4096(H) x 2160(V) = 8,847,360 pixel =8.0 MP x 24 bit = 192 Mbit/s

Do đó, 4096 x 2160 chiếm nhiều băng thông hơn vì nó chứa nhiều pixel hơn hay nói một cách đơn giản là nhiều dữ liệu hơn. Nhưng nó cho hình ảnh rõ ràng hơn, sắc nét hơn khi cần xác định chủ thể, khuôn mặt hoặc kiểu xe hơi cũng như màu sắc hoặc biển số xe. Ngược lại, độ phân giải thấp hơn tạo ra ít băng thông hơn, nhưng đánh đổi là hình ảnh mờ hơn, kém rõ ràng hơn. Độ phân giải thấp hơn thường mang lại cho người vận hành giám sát nhận thức tình huống—xem những gì đang diễn ra hơn là xem chi tiết.

Độ phân giải không phải là thứ duy nhất quyết định độ rõ nét của hình ảnh. Hiệu suất quang học của ống kính, độ dài tiêu cự (thu phóng quang học), khoảng cách đến đối tượng, điều kiện ánh sáng, bụi bẩn và thời tiết cũng là những yếu tố quan trọng.

Frame Rate

Tốc độ khung hình trong các hệ thống giám sát video được đo bằng khung hình trên giây (FPS), có nghĩa là số lượng hình ảnh được tạo ra trong một giây. Tốc độ khung hình càng cao, chủ thể di chuyển trong video càng mượt mà. Tốc độ khung hình càng thấp, các chuyển động càng trở nên giật cục đến mức các đối tượng nhảy từ vị trí này sang vị trí khác mà không có bất kỳ thứ gì ở giữa. Băng thông tăng theo tốc độ khung hình. Tuy nhiên, một nửa tốc độ khung hình thường không làm giảm băng thông xuống một nửa vì hiệu quả mã hóa bị ảnh hưởng. Camera giám sát hiện đại có thể tạo ra tới 60 FPS. Tuy nhiên, giới hạn CPU đôi khi sẽ hạn chế FPS ở giá trị thấp hơn khi độ phân giải được đặt quá cao. Tìm cài đặt FPS tối ưu cho một cảnh là sự thỏa hiệp giữa các mục tiêu: nắm bắt tất cả thông tin liên quan mà không làm mất chi tiết thiết yếu giữa các khung hình so với cân nhắc về băng thông. Nếu camera đang theo dõi tổng quan yên tĩnh, thì không cần phải tăng tốc lên 30 FPS. Cài đặt từ 5 đến 15 FPS là đủ. Theo nguyên tắc thông thường, thay đổi diễn ra càng nhanh hoặc dự đoán chuyển động của chủ thể càng nhanh thì nên đặt FPS càng cao. Điều chỉnh FPS sau khi lắp đặt camera và theo dõi xem độ mượt của video có chấp nhận được hay không.

Cảnh phức tạp

Độ phức tạp của cảnh cũng ảnh hưởng đến băng thông mà máy quay video tạo ra. Nói chung, cảnh càng phức tạp thì càng cần nhiều băng thông để đạt được chất lượng hình ảnh nhất định. Ví dụ: cảnh có lá cây, hàng rào dây hoặc kết cấu ngẫu nhiên như trần bỏng ngô làm tăng độ phức tạp của cảnh. Những thứ khác, như một bức tường bình thường, sơn màu trơn hoặc ít chi tiết, được coi là một khung cảnh đơn giản. Tương tự như vậy, chuyển động hoặc chuyển động làm tăng độ phức tạp. Những người đi ngang qua, ô tô chạy ngang qua hoặc lá cây trong gió là những ví dụ.

Hệ thống giám sát video
Hình 5 Cảnh phức tạp, tốc độ bit của video là 5 Mbit/s

Số lượng máy ảnh và khách hàng Số lượng camera ảnh hưởng đến các yêu cầu về băng thông cho hệ thống giám sát video. Nếu tất cả các camera đều giống nhau, thì số lượng camera gấp đôi sẽ nhân đôi dữ liệu được tạo. Để duy trì khả năng mở rộng của một hệ thống, nó phải có khả năng chia các cấu trúc liên kết lớn thành các phân vùng nhỏ hơn có thể quản lý được. Bằng cách cấu trúc hệ thống theo kiến ​​trúc phân lớp và phân tán, có thể duy trì khả năng mở rộng trên một phạm vi lớn về số lượng. Điều quan trọng là phân phối băng thông để tránh tắc nghẽn. Sẽ thảo luận thêm trong phần Tắc nghẽn băng thông. Số lượng khách hàng xem Các cuộc thảo luận ở trên liên quan đến việc cung cấp băng thông camera vào đầu ghi. Đây chỉ là một mặt của bức tranh, trong đó mặt còn lại đang kết nối đầu ghi với khách hàng đang xem video trực tiếp hoặc phát lại. Ví dụ: có thể có một nhóm bảo vệ liên tục giám sát các camera 24 giờ một ngày, bảy ngày một tuần. Băng thông này sẽ bằng với tất cả dữ liệu đến từ các camera. Trong trường hợp phát lại, thậm chí còn cần nhiều băng thông hơn nếu được sử dụng ngoài phát trực tiếp. Xem xét có thể có nhiều máy khách kết nối với một hệ thống cùng một lúc, lưu lượng truy cập phía máy khách có thể là mối quan tâm chính.