论文摘要
随着信息技术特别是网络技术飞速发展,人们收集、存贮、传输数据能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值数据的能力却非常匾乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘在实际应用中发挥着巨大的作用。“创新平台,打击精确”这是公安局科技强警系统工程中的重点项目,在“警务信息”平台上实现了网上查询、网上追逃、网上破案的日常化和系统化,极大提高了公安机关破案攻坚的能力。但这种方法也是事先设定好的,往往并不能挖掘案件嫌疑人,处理比较单一,尤其对于海量数据,查询速度慢、效率低下、准确率不高。为克服以上缺点,采用数据挖掘技术尤为重要。本文以数据挖掘为最基本问题,针对传统的k-均值算法聚类时初始聚类中心难以确定的缺点,我们对k-均值算法进行改进,在确定初始K类时,加入相对应的权重因子,增强了收敛性,达到全局最优,从而实现了聚类中心的确定。运用改进的k-均值算法对犯罪数据做逼近实验,验证了此方法的有效性。改进的k-均值算法,达到了追逃嫌疑人目的,获得了很好的预测效果,对于管理决策、科学调控有重要的实战意义。
论文目录
摘要ABSTRACT第1章 绪论1.1 研究背景及意义1.2 国内外的研究现状1.3 研究意义与目的第2章 数据挖掘分析2.1 数据挖掘产生与前景2.2 数据挖掘的定义2.3 数据挖掘采用的方法2.4 数据挖掘流程第3章 数据分析处理3.1 业务数据说明3.1.1 代码(字典)管理3.1.2 数据整合过程异常处理措施3.1.3 数据整合过程中减小系统影响3.1.4 判断新鲜数据3.2 准备数据聚类3.2.1 数据的抽取、简单转换3.2.2 数据的清洗过滤3.2.3 数据的转换3.2.4 数据的集成和装载3.2.5 数据库的导入导出第4章 系统设计4.1 数据库设计4.1.1 数据库设计原则4.1.2 元数据4.1.3 元数据管理4.1.4 数据库建设分析4.1.5 建设多主题数据库4.1.6 建立犯罪信息资源库4.2 功能模块设计4.2.1 公共数据交付模块4.2.2 K-means算法实实现模块4.2.3 改进K-means算法实现模块4.2.4 校正逼近模块4.2.5 系统展现模块第5章 聚类模型建立5.1 聚类模型机理分析5.1.1 聚类的概念5.1.2 资金流异常检测5.1.3 物流与资金异常分析5.1.4 关联确定嫌疑人第6章 算法与实验6.1 文本挖掘分析处理6.1.1 文本挖掘描述6.1.2 SHA-1分析处理6.1.3 文本SHA-1实现代码6.2 K-means算法6.2.1 K-means算法实现步骤6.2.2 实现K-means算法代码6.3 改进的K-means算法6.3.1 改进算法描述6.3.2 执行聚类算法6.3.3 选取合适的分类权值6.4 改进K-means实现6.4.1 改进K-means算法部分代码6.4.2 改进算法实验结果第7章 总结与展望7.1 结论7.2 方向及展望参考文献攻读学位期间的研究成果目录致谢
相关论文文献
标签:算法论文; 数据挖掘论文; 犯罪数据论文;