论文摘要
在视频监控领域,智能分析视频中的人的行为成为视频监控的发展趋势,在此过程中,人的识别与跟踪意义重大。通过对视频中每个个体进行识别和监控,可以分析出人群的走向、人群的流动方式等,从而提取有效信息,进行智能地视频监控。然而在复杂的场景中,由于受光线、动态的背景、人与人的遮挡和交叉等很多因素的影响,在已有的二维视频图像处理中,人的检测并没有很强的鲁棒性。随着深度摄像机的发展,价格也逐渐亲民化,为智能视频监控的普及提供了有利条件。本文就利用微软推出的深度相机产品Kinect,进行复杂场景中人群的识别与跟踪[1]。采集到带有深度信息的的视频影像后,从深度信息中提取有效的信息,结合二维的图像信息,能够较好地从视频的每一帧中识别出人,识别准确率较之单单从二维视频数据提取信息高出很多。进一步对检测出的每个人进行跟踪,分析得出监控结论。本系统完成过程的主要步骤如下:一、调研目前的视频监控系统现状,已解决的问题及目前仍然存在的限制。二、研究Kinect的工作原理、技术特征、接口及应用等。三、完成系统的前期调试工作:Kinect外部参数验证、内部参数标定、场景选取、通过试验确定Kinect的安置角度、系统实验数据的拍摄等。四、基于拍摄得到的实验数据,参照Xia. Lu提出的一种人群检测的算法[2],进行改进和优化,完成系统中人群检测的功能:1、对原始的深度影像进行噪声去除和平滑处理[3];2、对深度图像进行距离变换的处理,使用Q形状进行初步的头部匹配;3、利用标定数据,计算深度影像中每个像素的点云信息;4、选择3D的半球,进行进一步的头部匹配,得到图像中的人体头部;5、分离人与地面,利用区域增长法,得到人体的整个轮廓,完成检测。五、得到检测结果后,在相邻帧之间,进行人体整体颜色直方图的匹配,实现人群的跟踪。六、分析识别和跟踪的结果,调整参数,得到使系统效果最优的配置。结合系统的特点,分析系统已解决的问题和可以提高改进的地方,进一步完善系统。根据以上要求,我们选取闹市区的服装店作为实验数据采集点。利用C++进行编程,调用opencv等函数库,利用Matlab进行相关数据处理,从而实现在复杂场景中人群检测和跟踪的监控系统。