论文摘要
数据挖掘技术在公安工作中的研究与应用尚处于起步阶段,许多公安业务信息系统还停留在初级处理水平,缺乏综合性的开发应用,智能化的分析研判,科学性的决策预警;缺乏对数据由微观到宏观的加工能力,由宏观数据到微观数据的问题发现手段。如何利用数据挖掘技术挖掘和提取潜藏在大量业务数据中具备关联性的规律趋势,提高公安执法效率与快速反应能力、及时预防和打击犯罪行为,为警务决策提供支持服务,是本文研究的重点。本文主要工作如下:针对传统Apriori算法在公安犯罪行为分析中忽略了不同项间不同重要性的问题,提出了改进的加权关联规则挖掘算法WARMA。改进算法设计了加权关联规则模型,通过提出的k-支持期望概念来排除不可能成为加权频繁k-项集的候选集子集,解决了加权关联规则挖掘中加权频繁项集的子集可以不是加权频繁项集的问题。实验及分析表明:算法WARMA有着较少的候选集和较短的执行时间,能更有效的发现重大犯罪行为。针对传统Apriori算法在公安犯罪行为分析中无法及时敏锐的发现某些新型犯罪行为的问题,提出了基于FUP的改进关联规则增量式更新算法SFUP,SFUP算法通过用敏感参数衡量对新项目的重视情况,改进了一般增量式更新算法产生频繁项集的过程。实验及分析表明:改进算法在越大数据量下优势越明显,能更有效的发现新型犯罪行为,在挖掘过程中显示了良好的空间和时间性能。针对传统ID3算法在公安犯罪行为分析中存在的问题,提出了一种基于先验参数的改进算法BID3,BID3算法通过增加先验参数B,既?硕灾匾粜缘谋曜?使得决策树减少了对取值较多的属性的依赖性,尽可能减少大数据掩盖小数据的现象发生。实验及分析表明:在处理越大规模数据集的决策树构造过程中,BID3算法在效率和性能上比ID3算法有更大的优越性。在结合公安犯罪行为分析实际的基础上,进行了基于决策树算法的犯罪行为分析原型系统设计与实验,提出了功能需求与系统流程图,介绍了原型系统模块构成和实现。实验及分析表明:运用数据挖掘技术对公安信息数据库中的海量数据进行挖掘处理,发现趋势规律,从而快速准确的辅助警务决策,在公安工作中具有重要的现实意义。
论文目录
摘要Abstract插图索引附表索引第1章 绪论1.1 研究背景1.2 国内外研究现状1.2.1 国外研究现状1.2.2 国内研究现状1.3 研究目的与意义1.4 研究内容1.5 组织结构第2章 数据挖掘与公安信息化2.1 数据挖掘2.1.1 数据挖掘定义2.1.2 数据挖掘任务2.1.3 数据挖掘方法2.1.4 数据挖掘的应用领域2.1.5 数据挖掘研究的动态发展趋势2.2 公安信息化2.2.1 公安工作与信息化2.2.2 金盾工程2.2.3 我省公安信息化现状2.3 数据挖掘在公安工作中的应用2.4 数据挖掘在公安工作中的展望2.5 本章小结第3章 违法犯罪行为的关联性分析3.1 引言3.2 关联规则及Apriori 算法3.2.1 关联规则基本概念3.2.2 关联规则的种类3.2.3 关联规则 Apriori 算法思想3.2.4 算法 Apriori 的性能瓶颈问题3.3 关联规则挖掘在违法犯罪行为应用中存在的问题3.3.1 在违法犯罪行为中的应用3.3.2 存在的问题3.4 一种改进的加权关联规则挖掘算法WARMA3.4.1 加权关联规则模型3.4.2 权值参数的设定3.4.3 算法 WARMA 的基本思想3.4.4 算法 WARMA 描述3.4.5 算法 WARMA 实验及分析3.4.5.1 算法 WARMA 实验数据3.4.5.2 算法 WARMA 性能测试及分析3.5 基于 FUP 的改进关联规则增量式更新算法3.5.1 算法 FUP 的分析3.5.2 基于敏感参数的改进算法 SFUP3.5.3 算法 SFUP 基本思想3.5.4 敏感参数的含义3.5.5 算法 SFUP 描述3.5.6 算法 SFUP 实验及分析3.5.6.1 算法 SFUP 实验数据3.5.6.2 算法 SFUP 性能测试及分析3.6 本章小结第4章 基于决策树的违法犯罪行为分析4.1 决策树分类算法4.1.1 ID3 算法基本原理4.1.2 ID3 算法基本概念4.1.3 ID3 算法优劣分析4.1.4 其他分类算法简述4.2 传统 ID3 算法在犯罪行为分析应用中存在的问题4.2.1 ID3 算法的应用4.2.2 存在的问题4.3 一种基于先验参数的改进算法 BID34.3.1 基于先验参数的BID3 算法描述4.3.2 先验参数的确定4.3.3 实验及分析4.3.4 算法的性能测试4.4 基于决策树算法的犯罪行为分析原型系统的设计与实验4.4.1 功能需求与系统流程图4.4.2 原型系统模块构成4.4.3 原型系统实现4.5 在公安实际系统中的应用信息4.6 本章小结结论参考文献附录A 攻读学位期间发表的论文和参加的项目致谢
相关论文文献
标签:数据挖掘论文; 算法论文; 权值参数论文; 敏感参数论文; 先验参数论文;