K-Means聚类算法在犯罪数据挖掘中的应用

K-Means聚类算法在犯罪数据挖掘中的应用

论文摘要

随着信息技术特别是网络技术飞速发展,人们收集、存贮、传输数据能力不断提高。数据出现了爆炸性增长,与此形成鲜明对比的是,对决策有价值数据的能力却非常匾乏。知识发现与数据挖掘技术正是在这一背景下诞生的一门新学科。数据挖掘在实际应用中发挥着巨大的作用。“创新平台,打击精确”这是公安局科技强警系统工程中的重点项目,在“警务信息”平台上实现了网上查询、网上追逃、网上破案的日常化和系统化,极大提高了公安机关破案攻坚的能力。但这种方法也是事先设定好的,往往并不能挖掘案件嫌疑人,处理比较单一,尤其对于海量数据,查询速度慢、效率低下、准确率不高。为克服以上缺点,采用数据挖掘技术尤为重要。本文以数据挖掘为最基本问题,针对传统的k-均值算法聚类时初始聚类中心难以确定的缺点,我们对k-均值算法进行改进,在确定初始K类时,加入相对应的权重因子,增强了收敛性,达到全局最优,从而实现了聚类中心的确定。运用改进的k-均值算法对犯罪数据做逼近实验,验证了此方法的有效性。改进的k-均值算法,达到了追逃嫌疑人目的,获得了很好的预测效果,对于管理决策、科学调控有重要的实战意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外的研究现状
  • 1.3 研究意义与目的
  • 第2章 数据挖掘分析
  • 2.1 数据挖掘产生与前景
  • 2.2 数据挖掘的定义
  • 2.3 数据挖掘采用的方法
  • 2.4 数据挖掘流程
  • 第3章 数据分析处理
  • 3.1 业务数据说明
  • 3.1.1 代码(字典)管理
  • 3.1.2 数据整合过程异常处理措施
  • 3.1.3 数据整合过程中减小系统影响
  • 3.1.4 判断新鲜数据
  • 3.2 准备数据聚类
  • 3.2.1 数据的抽取、简单转换
  • 3.2.2 数据的清洗过滤
  • 3.2.3 数据的转换
  • 3.2.4 数据的集成和装载
  • 3.2.5 数据库的导入导出
  • 第4章 系统设计
  • 4.1 数据库设计
  • 4.1.1 数据库设计原则
  • 4.1.2 元数据
  • 4.1.3 元数据管理
  • 4.1.4 数据库建设分析
  • 4.1.5 建设多主题数据库
  • 4.1.6 建立犯罪信息资源库
  • 4.2 功能模块设计
  • 4.2.1 公共数据交付模块
  • 4.2.2 K-means算法实实现模块
  • 4.2.3 改进K-means算法实现模块
  • 4.2.4 校正逼近模块
  • 4.2.5 系统展现模块
  • 第5章 聚类模型建立
  • 5.1 聚类模型机理分析
  • 5.1.1 聚类的概念
  • 5.1.2 资金流异常检测
  • 5.1.3 物流与资金异常分析
  • 5.1.4 关联确定嫌疑人
  • 第6章 算法与实验
  • 6.1 文本挖掘分析处理
  • 6.1.1 文本挖掘描述
  • 6.1.2 SHA-1分析处理
  • 6.1.3 文本SHA-1实现代码
  • 6.2 K-means算法
  • 6.2.1 K-means算法实现步骤
  • 6.2.2 实现K-means算法代码
  • 6.3 改进的K-means算法
  • 6.3.1 改进算法描述
  • 6.3.2 执行聚类算法
  • 6.3.3 选取合适的分类权值
  • 6.4 改进K-means实现
  • 6.4.1 改进K-means算法部分代码
  • 6.4.2 改进算法实验结果
  • 第7章 总结与展望
  • 7.1 结论
  • 7.2 方向及展望
  • 参考文献
  • 攻读学位期间的研究成果目录
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    K-Means聚类算法在犯罪数据挖掘中的应用
    下载Doc文档

    猜你喜欢