论文摘要
视频行为分析是一项极具意义和挑战性的工作,在日常的应用及监控中都有很大的需求。目前的研究方法主要根据所处理的特征不同而分为基于轨迹的和基于运动像素块的。基于轨迹的方法需要依赖于较为准确的轨迹提取,而基于运动像素块的则依赖于底层运动特征的提取。基于运动像素块的视频行为分析方法主要研究从运动特征中如何挖掘出抽象的行为。主题模型具有挖掘出数据背后所隐含的抽象主题的能力,主要用于文本分类检索。主题模型主要包括隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)(?)口层次狄利克雷过程(Hierarchical Dirichlet Processes,HDP),后者是一个无参的层次贝叶斯模型,能自动决定数据所对应的主题个数,而前者需要预先设定主题个数。运用主题模型相当于对数据进行抽象降维处理,将原本以较高维度单词表示的原始数据转化为以较低维度主题表示的数据,这样处理能便于进行数据分类检索。由于主题模型的这一特性,近年来很多研究者将其迁移到视频行为分析中来,利用主题模型挖掘出运动特征所对应的行为主题。由于主题模型本身是基于词袋模型假设,忽略了结构信息,而视频图像本身是时空特性的数据,因此需要在主题模型中引入结构信息。大多数研究者也对主题模型做了改进,主要是增加模型的层次和将模型时间序列化以研究行为的动态变化。本论文的研究围绕引入结构信息的主题模型展开,主要的研究工作如下:·我们提出了一种引入结构信息的方法,相对于其它的方法,我们主要将运动像素块的位置和方向作为观测变量加入到主题模型中,重新组织底层特征。这种方法可以看做是将运动特征附加两个属性—方向和位置。·我们提出了基于LDA和HDP模型的改进方法。在基于LDA模型的改进中,我们将运动方向作为运动位置的附属标签,这符合人们观察运动目标的习惯先确定运动目标的位置再确定运动的方向。我们预先设定主题的个数,并将不同主题个数下的结果可视化,通过分析比较可视化结果确定在设定某个主题数下主题所对应的原子行为能完全表示视频中的所有场景。在基于HDP模型的改进中,我们提出了两种引入结构信息的方法。第一种是和LDA模型中一样将运动方向作为运动位置的附属标签,预先确定运动方向对应主题的个数,而让模型自动确定运动位置对应的主题个数;第二种是将运动方向和运动位置都看做独立的变量,让模型自动确定其各自对应的主题个数。整个模型所得到的行为主题则是这两类属性主题的组合。相比于LDA模型,基于HDP模型的改进应用不用再分别尝试设置不同主题数,而直接由模型自动判断。·将改进的模型应用于视频行为分析中,在QUML交通路口车流和行人数据上,通过实验表明引入结构信息的主题模型更能挖掘出视频中的原子行为。相对于原始的LDA模型,我们的模型挖掘出的原子行为在粒度上更细,在设定相同主题数下能更好得表现视频的场景行为。而相对于原始的HDP模型,我们的模型能更好地控制挖掘出的行为数。根据原子行为的组合,即其能否同时出现,我们能对视频场景行为进行分析,判断是否有异常出现。
论文目录
相关论文文献
标签:主题模型论文; 视频行为分析论文; 隐含狄利克雷分配论文; 层次狄利克雷过程论文;