论文摘要
针对地铁、火车站和机场等拥挤场景的自动视频分析是计算机视觉领域中的一个研究热点。其中,异常行为检测的主要任务是从拥挤场景中检测出背离场景运动规律的行为。由于异常行为检测可以提供较正常行为更具价值的信息,拥挤场景中的异常行为检测算法研究已势在必行。与一般场景中异常检测不同,拥挤场景中异常检测的难点在于监控设备监视着大量的行人及其复杂多变的运动,这使得针对拥挤场景的异常检测算法在场景运动建模及异常行为检测上都面临着更多的困难。本文给出了一个新的拥挤场景中异常行为检测的算法框架。本文首先使用立体相机提取深度信息,以捕捉行人在摄像机法方向上的运动。然后,将场景视频构成的时空体分割成局部时空块,分别使用3维的高斯分布和高斯混合模型对局部时空块中的运动模式进行建模。接下来,创建一组关系共现矩阵,并使用马尔科夫随机场对运动模式间的共现关系进行建模。最后,结合两个层次的图像金字塔,将统计偏离的运动模式检测为异常行为。本文方法具有以下优点:1)与仅使用2维运动信息的方法不同,本文方法集成了深度信息,并提出了一种新的局部运动模式以描述局部时空位置上的运动信息;2)给出了一个新的时空上下文模型,揭示了局部运动模式之间的时空共现关系。由于拥挤场景是由大量局部运动及其相互关系共同组成,时空上下文模型能够准确地描述相邻运动模式之间的相互关系,表示运动模式之间的一致性共现关系;3)使用图像金字塔来减少肢体动作对异常检测过程带来的干扰,以更准确地对拥挤场景进行建模,并高效、鲁棒地检测其中的异常行为。在一个由4个场景类别构成的新的深度图像数据集上的实验表明,本文算法在包含复杂运动的真实拥挤场景中具有较好的性能。