网络视频监控技术

课程地址:中国大学MOOC-网络视频监控技术

视频监控技术概述

视频监控技术应用

  1. 网络视频监控
  2. 智能视频识别:视频内容分析技术,可以快速通过对视频内容的快速检查并提取出关键的信息。识别和预警。

视频监控技术发展过程

  1. 模拟视频监控阶段,闭路电视监控系统(CCTV)
    1. 闭路电视和开路电视:闭路电视(模拟摄像机、传输系统、视频显示),开路电视(模拟摄像机、信号塔、卫星、信号接收器、视频显示)
    2. 模拟视频监控系统的组成:
      1. 视频信号采集部分(信号采集设备:摄像机、防护罩、镜头、支架、解码器、电动云台,实现的主要功能是将光信号转化为电信号)
      2. 信号传输部分:负责将摄像机的电信号传输到矩阵主机或显示与记录设备,或是反向将矩阵主机【控制终端】的控制信号发送给解码器以控制云台动作,是一个负责视频信号的上行传输和控制信号的下行传输。主要负责设备有信号收发器、信号放大器、铜缆、光缆等
      3. 切换控制部分:这个部分是系统的核心,主要功能是进行视频图像的切换以及前端设备的控制(与数字监控有本质区别),设备主要包括矩阵控制器、控制键盘、控制码发生器等。
      4. 显示与录像部分:主要用来显示和记录前端摄像机传输过来的视频信号。显示与记录设备主要包括监视器、多画面分割器、多画面控制器、磁带录像机等。
  2. 数字视频监控阶段:20世纪90年代开始,
    1. 核心设备:硬盘录像机
    2. 功能:模拟视屏信号有硬盘录像机是实现数字化编码压缩并进行存储。
    3. 组成:视频采集卡、编码压缩程序、存储设备、网络接口及软件体系。
    4. 产品形态:
      1. PC式:一般采用工业主板加视频采集卡的构架,软件建立在Windows(或者Linux)操作系统上,功能强大。
      2. 嵌入式:基于嵌入式处理器和嵌入式实时操作系统,结构单一,性能稳定。
    5. 优势:录像时间长,支持多路同时录像,图像质量不会随着时间推移而变差。
    6. 编码压缩算法:硬盘录像机DVR的关键技术,主流算法:JPEG,MPEG-4。升级改进算法:H.264
  3. 智能网络视频监控阶段:
    1. 主要功能:可以实现视频网络传输、远程播放、存储、视频分发、远程控制、视频内容分析和自动报警等。
    2. 主要构成:由网络摄像机(IPC)、视频编码器(DVS)、高清摄像机、网络录像机(NVR)、海量存储系统、视频内容分析(VCA)、以及中央管理平台(CMS)构成。

视频监控技术的核心技术

  1. 光学成像器件
    1. 网络视频监控系统的核心组件
    2. 主要包括:镜头、感光器件(CCD【电荷耦合器件】、CMOS【互补金属氧化物半导体】)
  2. 视频编码压缩算法:
    1. 在尽可能的保证视觉效果的前提下减少数据量。
    2. 视频监控系统数字化、网络化的前提。
  3. 视频编码压缩芯片:
    1. 视频编码压缩的核心是算法,但算法的实现是基于运算处理芯片的。
    2. 算法在不断的改进以降低码流,提升图像质量,代价就是提高了算法的复杂度,相应的就要不断地提升芯片的处理能力。

视频监控技术的发展方向

  1. 开放性
    1. 现状:不同的厂家的编码设备,平台软件、存储、控制设备无法互联。
    2. 问题:系统需要二次开发和大量的后期整合。
    3. 解决:构建开放式的视频管理平台,实现零开发的互联互通。
  2. 智能化
    1. 视频内容分析技术利用计算机视觉技术,通过将场景中的背景和前景目标分离,进而探测、提取、理解、跟踪、在场景中内出现的目标并进行行为识别。
    2. 用户可以通过在场景中预设报警规则,一旦目标在场景中出现违反 预定规则的情形,系统会自动发出预警,监控工作站自动弹出预警信息并发出提示音,用户可以通过点击预警信息,实现预警的视频场场景重构并采取相关措施。
  3. 高清化:
    1. 基于高清网络摄像机的问世,较传统模拟摄像机、普通网络摄像机真正有很多优势:
      1. 高清晰度,百万像素级别的传感器,可以获得更多的视频信息。
      2. 逐行扫描技术可以让画面更清晰,自然流畅,无失真。
      3. 数字云台控制功能,没有机械部件,更稳定耐用。
      4. 一个高清摄像机可以代替多个普通摄像机,对相同范围的场景进行监控,节省线缆,安装以及维护成本。
  4. 民用化
  5. 无线化
  6. 常用术语:
    1. 智能视频监控系统(IVS)
    2. 闭路电视监控系统(CCTV)
    3. 盒式磁带录像机(VCR)
    4. 硬盘录像机(DVR)
    5. 混合DVR(HDVR)
    6. 网络录像机(NVR)
    7. 视频编码器(DVS)
    8. 网络摄像机(IPC)
    9. 高清摄像机(HD IPC)
    10. 百万像素摄像机(MPC)
    11. 中央管理系统平台(CMS)
    12. 视频内容分析(VCA)
    13. 安全防范及视频监控(SAS)

模拟视频监控系统

  1. 模拟监控系统的组成
    1. 前端:信号采集部分
    2. 中间:信号传输部分
    3. 后端:矩阵切换部分
    4. 显示及录像部分
  2. 视频采集设备
    1. 包括:
      1. 摄像机、镜头、云台、解码器(对控制信号进行翻译,使得镜头和云台能够读懂信号,并且产生相应的操作)、支架、防护罩。
      2. 室内:摄像机、镜头。
      3. 室外:支架、防护罩、辅助灯光、加热器、雨刷。
      4. 大范围监控:云台、变焦镜头。
    2. 摄像机的工作原理:
      1. 主要部件:电耦合器件(CCD)
      2. 工作原理:
        1. 被摄物体反射的光线传播到镜头上
        2. 经过镜头聚焦到CCD芯片上
        3. CCD根据光的强弱积累相应的电荷
        4. 各个像素积累的电荷在视频时序的控制下逐点转移
        5. 经过滤波放大处理后形成视频信号输出 3.摄像机的分类:
      3. 色彩:彩色摄像机和黑白摄像机
      4. 照度(能够在多暗的情况下拍摄到能够让我们人眼识别的景象):一般照度、低照度、星光照度
      5. 外形“枪式摄像机、半球式摄像机、一体云台摄像机
    3. 摄像机的主要参数:
      1. CCD尺寸:CCD尺寸指的是CCD图像传感器感光面的对角线尺寸,主要有1/4、1/3、1/2,在相同的像素下,CCD面积不同,感光点的大小也就不同。感光点负责光电转换,面积越大,能够容纳的电荷的极值也就越高,对光线的敏感性也就越强,描述的图像层次也就越丰富。
      2. 分辨率:
        1. 是指在视频摄录、传输和显示过程中所使用的图像质量指标,或是显示设备自身具有的表现图像的细致程度的固有屏幕结构,也就是指单幅图像信号的扫描格式或者显示设备的像素规格。
        2. 单位是Pixels,代表水平行和垂直列的像素数目。
      3. 最低照度:
        1. 照度:照射到单位面积的光通量,单位是勒克斯(Lx)
        2. 最低照度:测量摄像机感光度的一种方法,即摄像机能够在多黑的条件下还可以看到可用的景象。
        3. 黑白摄像机:0.01-0.5Lx
        4. 彩色摄像机:0.1Lx以上
      4. 例子:0.025Lx/F1.4/50IRE/AGC ON指的是0.25Lx的最低照度使用F1.4光通量镜头、视频信号测量电压在50TRE(350mV)、AGC为ON的情况下测出来的
      5. 电视传输规定的标准电平700mv
      6. AGC:Automatic Gain Control自动增益控制。
      7. 不同天气情况下照度的参照值:
        1. 太阳直射:10万
        2. 晴间多云:1万
        3. 阴雨天:1000
        4. 全月晴空:0.1
        5. 半月晴空:0.01
        6. 无月晴空:0.001
      8. 自动控制增益AGC:
        1. 摄像机有一个将来自CCD的信号放大到“可以使用的水准”的视频放大器
        2. AGC就是控制这个视频放大器在微光下放大信号,在强光下不工作,从而摄像机能够在较大的光照范围内工作。
      9. 背景光补偿BLC:即Blacklight Compensation,可以有效的补偿摄像机在逆光环境下拍摄时画面主体黑暗的缺陷,原理是部分可见区域(黑暗区域)的AGC工作。
    4. 镜头的主要参数:
      1. 焦距:“摄像机能看清多远的物体”和“摄像机能看清多宽的场所”
        1. 摄像机能看清多远的物体:短焦距(广角镜头观察并发现目标物)、中焦距(中等镜头识别目标物-“人”)、长焦距(小角度镜头鉴别目标物-“谁”)
        2. 能看清多宽的场所:短焦距(90度左右)中焦距(40度左右)长焦距(15度左右)
      2. 理论上,任何焦距的镜头均可拍摄和远的目标,并在CCD的靶面上成像,但受到CCD单元(像素)的尺寸的限制,当成像小到小于CCD传感器的一个像素大小时,便不再能形成被摄物体的像。
      3. 成像场景的大小与成像物的显示尺寸是互相矛盾的。需要使用云台和变焦镜头来配合。
      4. 镜头尺寸:选用镜头应与摄像机的靶面尺寸大小相吻合。
        1. 小尺寸靶面DeCCD可以使用大尺寸的镜头
        2. 反之则不行,因为小镜头的进光量不能满足大尺寸的CCD。
      5. 相对孔径:
        1. 镜头中设有光圈,光圈的相对孔径等于镜头的有效孔径与镜头焦距之比
        2. 镜头的相对孔径表征了镜头的通光力,孔径越大,通光越多。
      6. 镜头接口:按照镜头与摄像机接触面至镜头焦平面(摄像机CCD光电感应器处的位置)的距离进行划分。
        1. C口:距离为17.5mm
        2. CS口:距离为12.5mm
        3. C型镜头配C型摄像机
        4. CS型镜头配CS型摄像机
        5. C型镜头加5mm转接口配CS型摄像机
  3. 信号传输设备
    1. 监控系统视频信号的传输非常重要,由于视频信号信息量大,频带宽,实时性强,因此视频监控系统中信号传输的重点就是视频信号的传输。
    2. 常见的视频传输信号的传输方式有三种:
      1. 同轴电缆传输方式:摄像机、同轴电缆、计算机
      2. 双绞线传输方式:摄像机、适配器(将光信号转换为可传输信号)、双绞线、适配器(逆转换)、计算机
      3. 光纤传输:摄像机、光端机、光纤、光端机、计算机
    3. 视频分配器:当视频输出路数比较多时,并联视频信号的衰减较大,送给多个设备后由于阻抗不匹配等原因造成图像失真、线路不稳定。
      1. 作用:一路视频输入,多路视频输出,同时有阻抗匹配和信号放大的作用。
    4. 控制信号的传输:
      1. 控制信号主要是进行云台控制,镜头控制,辅助设备控制,切换控制,电源控制,以及录像控制。、
    5. 系统供电:
      1. 单独布线:远距离:220V转12V或者24V,近距离:直接使用12V或者24V,另外需要注意,电源线和信号线需要保持有一定的距离。
  4. 矩阵切换设备
    1. 矩阵工作原理:
      1. 问题:摄像机与监视器或录像机“一对一”模式不能满足需求。
      2. 解决办法:矩阵切换器可以实现选择任意一台摄像机的图像在任意指定的监视器上面输出显示。
      3. 原理:假如前端部署有8个摄像头,分别去拍摄不同的体育项目实时画面,而后端的电视台有4个频道,如果想在第一频道转播射击场地的画面,就把射击画面切换到频道一输出中,其他一次类推。
    2. PTZ控制:
      1. PTZ在安防监控是Pan/Tilt/Zoom的简写,代表云台全方位(上下、左右)移动及镜头变倍、变焦控制。
      2. 解码器接收到矩阵主机控制器发来的控制信号,解码为电压信号,该电压信号直接驱动摄像机以及云台的PTZ动作。
  5. 显示以及录像设备
    1. 多画面分割器:使多个监视器的画面同时显示在一个监视器上
      1. 8个摄像机拍到的场景视频信号通过视频分割器放在一个显示器上面进行显示
      2. 在回放时候,仍然以分割后的画面进行回放,如需单画面回放,只是电子放大,必然没有原始图像清晰。
    2. 时间分割技术:
      1. 按照最小单位(场或者帧)的图像时间依序显示和存储。
      2. 比如有四个摄像头,分别拍到举重、棒球、射击、足球,在存储设备中第一帧存“举重”,下一帧存“棒球”,然后是“射击”、“足球”,然后在进行一个轮回的存储。当进行回放时,比如要回放举重,只需要把棒球的所有帧提取出来,进行组合显示到显示器上面。

视频编码压缩技术

图像的彩色模型

  1. 简介:
    1. 图像的彩色模型又叫颜色空间
    2. 在多媒体系统中,必然涉及到用不同的色彩模型表示图像的颜色。如计算机在显示时采用RGB模型,在彩色电视数字化系统中使用YUV色彩模型,彩色印刷时采用CMYK彩色模型等。
    3. 在图像生成,存储,处理以及显示时,需要不同的色彩模型处理和转换。
  2. RGB彩色模型:
    1. 即三原色,在数字图像中,对RGB三原色进行8位编码就构成了大约16.7万种颜色,这就是我们常说的真色彩。
    2. 颜色=R(红色百分比)+G(绿色百分比)+B(蓝色百分比)
      1. 白色=R(100%)+G(100%)+B(100%)
      2. 黄色=R(100%)+G(100%)+B(0%)
      3. 红色=R(100%)+G(0%)+B(0%)
  3. HSL色彩模型:
    1. 色调、饱和度、亮色颜色模型
    2. H-颜色波长,成为色调(Hue),色调是由于某种波长的颜色光是观察者产生的颜色感觉,它决定了颜色的基本特征。例如:红色、蓝色皆是指色调。
    3. S-深浅程度:称为饱和度(Saturation)
    4. L-掺入的白亮光,称为亮度(Lightness),是光作用于人眼时所引起的明亮程度的感觉。
  4. YUV色彩模型:
    1. YUV颜色空间是由亮度信号Y和两个色差信号色度信号U、V组合而成。Y信号分量表示的时黑白灰度图,由RGB色彩模型按照下述公式生成,UV信号分量则构成另外两个单色图。Y=0.3R+0.59G+0.11B
    2. Y和色度信号U、V是分离的。(实现了黑白电视接受彩色信号)
  5. lαβ色彩模型:
    1. lαβ是由国际照明委员会(CIE)制定的一种色彩模式,l、α、β分别表示亮度、红绿、以及蓝黄相关信息。
    2. lαβ颜色是由RGB三基色转换而来的。
  6. CMY色彩模型:
    1. CMY颜色空间源自RGB颜色空间
    2. 把红、绿、蓝、三种基色交互重叠就产生了次混合色青(Cyan)、洋红(Magenta)、黄(Yellow)
  7. CMYK色彩模型:
    1. CMYK颜色空间广泛应用于印刷工业,但在实际的印刷中,一般采用青(C)、品(M)、黄(Y)、黑(BK)四色印刷。
    2. 在印刷的中间调至暗调增加黑色,而这种模型称之为CMYK。

图像的基本属性和图像的质量评价

  1. 图像的基本是属性:
    1. 分辨率:
      1. 显示分辨率(显示屏能够显示的像素数目)
      2. 图像分辨率(是组成一幅图像的像素密度的度量方法)
    2. 像素深度:
      1. 是指每一个像素所使用的位数(bit),像素深度决定了色彩图像的每个像素可能拥有的颜色数,或者灰度图像的每个像素可能有的灰度级数。
      2. 例子:RGB彩色模型的图像,若R、G、B每个分量用8位表示,那么一个像素要用24位表示,每个像素的颜色可以有2^24,即16777216种颜色。
  2. 图像的质量评价:
    1. 主观评价方法:图像呈现的人的面前后,人为的评价。
    2. 客观评价方法:
      1. PSNR--峰值信噪比
      2. 通常在经过压缩后,输出的图像都会有某种程度的失真,为了衡量经过编码后的图像品质,通常会参考PSNR值来认定某个压缩算法程序是否令人满意,它的单位是dB。

静态图像压缩技术

  1. 数据压缩的前提:
    1. 数据能够压缩,是因为数据中存在或多或少的冗余信息,而对于视频和音频等多媒体信息,更可以利用人类自身的感知冗余(失真)特点来实现更高的压缩比例。
    2. 人类视觉系统对于图像的注意是非均匀的,一般情况下分辨能力约为64个灰度等级,而一般图像量化采用256灰度等级,这类冗余我们成为视觉冗余。【对于一种类似蓝色的颜色,在计算机中每一点的像素值都是不完全一样的,但是人眼去看,基本上觉得都是一种颜色,如果把这种颜色稍微做一些改变,变为相邻的一种蓝色,人眼是看不出的,如果改变64位以后或者离这个蓝色64位的一个差值,人眼才能大概发现】
    3. 人类视觉对亮度变化敏感,对颜色的分辨率弱,因此,视频编码算法需要充分利用人眼的“弱点”进行“欺骗性”设计。
  2. 数据压缩的方法:
    1. 根据解码后数据与原始数据是否一致,数据压缩方法分为两类:
      1. 有损压缩编码:(压缩以后有一部分数据要丢失)
        1. 变换编码:
          1. 离散余弦变换
          2. 离散小波变换
          3. 离散傅里叶变换
      2. 无损压缩编码:【统计编码】(不把原始数据丢掉,或者说进行解码时,可以完全恢复原来压缩以前的数据,把压缩以前的数据进行一个有效的整合,不去进行删减而是进行整合)
        1. Huffman编码
        2. 行程编码
        3. LZW编码
        4. 算术编码
      3. 混合编码:(将有损和无损结合使用)
        1. JPEG
        2. MPEG
        3. H.264
    2. Huffman编码:(哈夫曼编码)
      1. Huffman编码又称哈夫曼编码,是一种可变长编码方式,是由美国数学家David Huffman创立的,是二叉树的一种特殊转化形式。
      2. 编码的原理是将使用多次的代码转换成长度较短的代码,而使用次数较少的可以使用较长的编码,并且保持编码的唯一可解性。
      3. 步骤:
        1. 将输入符号(图像的灰度级)ai按照出现频率P(ai)由大到小排列,即P(ai)≥P(aj)≥P(ak)≥...
        2. 将最小的两个P(ai)相加形成一个概率集合(此时就缩减了一个P(ai)),在按照第一步重复直到剩下两个概率为止。
      4. 具体示例:
        1. 假设有一篇英文,且假设没有标点,长度为100
        2. 字母a出现了40次,字母b出现可20次,c16次,d12次,e6次,f4次,g2次。
        3. 1、3、5、7、9、11进行排序,2、4、6、8、10将排在最后的两个概率相加
        4. Huffman树的构建,把所有的左边的表示为0,把所有的右边的表示成为1,首先看下a,a为1,找到b的位置
        5. 可以看出a出现的次数最多,但是表达它的编码只使用了一位,g出现的次数最少,表达它的编码最多。
        6. 压缩以前,7个字母,需要3bit进行编码,a(000)b(001)c(002)d(003)e(004)f(005)g(006),这篇英文(100个字母),需要3100=300bit。压缩之后,a(1)b(000)c(001)d(010)e(0110)f(01110)g(01111),这篇英文需要140+320+316+312+46+54+52=238bit。压缩率为:(300-238)/300约等于21%。

动态视频压缩

主流视频编码技术

feihu分享到:

          

You may also like...

Scroll Up