离群数据挖掘在犯罪通讯痕迹发现中的应用

离群数据挖掘在犯罪通讯痕迹发现中的应用

论文摘要

随着现代通讯技术的发展,通讯工具已经成为人们日常生活与工作的得力助手,通讯活动也成为了现代生活的有机组成。在公安侦查实践中,人们发现许多犯罪活动中伴随着与犯罪关联的通讯活动,对这些活动的分析调查对公安侦查有很大帮助,公安侦查人员将与犯罪相关联的这些通讯活动称为犯罪通讯痕迹。由于犯罪分子反侦查意识不断提高,传统的社会调查方法获取犯罪通讯痕迹已经变得越来越困难。然而事实上,同普通通讯信息一样,犯罪通讯痕迹信息在其发生的那一刻起,就已经存在于相应通讯公司的信息数据库中,利用数据分析技术,将其从众多通讯信息中分离出来,将会为公安侦查开辟一条新途径。数据挖掘是从大量数据中获取有用信息的、并已经得到广泛应用的成熟的综合数据分析技术,本文分析了数据挖掘的主要过程与主要方法,并结合犯罪通讯痕迹的特点,提出使用离群数据挖掘方法分离犯罪通讯痕迹的方向,并随后对离群数据挖掘的主要方法进行了详细分析,结合犯罪通讯痕迹数据挖掘的独特特点,对相应的离群数据挖掘算法进行了改进,提出了主属性离群阀值、离群关系双K系数离群数据挖掘算法。本文随后结合相关公安侦查工作实践,提出了对通讯活动总体特征进行描述的具体方法,并使用SQL2005,根据离群关系双K系数算法,从某公司的通讯数据信息库中提取了实验数据,进行了数据的相应处理与转换,对犯罪通讯痕迹的离群数据挖掘予以编程实现,并通过对相关输出结果的专家分析,验证了算法的有效性,实现了将离群数据挖掘方法应用到犯罪通讯痕迹发现中的应用目标,本文最后对犯罪通讯痕迹数据挖掘未来研究方向和应用前景进行了展望。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究的背景
  • 1.2 课题的提出
  • 1.3 主要技术
  • 1.4 本文的主要研究内容
  • 第2章 数据挖掘理论
  • 2.1 数据仓库
  • 2.1.1 数据仓库的概念
  • 2.1.2 数据仓库的体系结构
  • 2.1.3 数据集市
  • 2.2 数据挖掘
  • 2.2.1 数据挖掘的概念
  • 2.2.2 数据挖掘的体系结构与一般过程
  • 2.2.3 数据挖掘的主要方法
  • 2.2.4 数据挖掘工具
  • 第3章 离群数据挖掘方法
  • 3.1 离群点的定义
  • 3.2 离群点发现方法
  • 3.2.1 基于统计的离群点检测
  • 3.2.2 基于距离的离群点检测
  • 3.2.3 基于偏离的离群点检测
  • 3.2.4 基于密度的离群点检测
  • 第4章 基于密度的离群数据挖掘算法的改进
  • 4.1 LOF算法存在的主要问题
  • 4.2 LOF的改进算法
  • 4.2.1 局部孤立系数算法
  • 4.2.2 K-距离因子算法
  • 4.2.3 增强的K-距离因子算法
  • 4.3 离群关系双K系数算法
  • 4.3.1 犯罪通讯痕迹数据挖掘特点分析
  • 4.3.2 离群关系双K系数数据挖掘算法
  • 第5章 犯罪通讯痕迹离群数据挖掘的实现
  • 5.1 系统框架
  • 5.2 数据集市的建立
  • 5.2.1 数据仓库的建立
  • 5.2.2 数据集市的建立过程
  • 5.3 离群关系双K系数犯罪通讯痕迹数据挖掘实现
  • 5.3.1 离群候选集对象通讯统计信息表的建立
  • 5.3.2 数据标准化处理
  • 5.3.3 离群关系双K系数挖掘
  • 5.4 下步工作方向
  • 第6章 总结与展望
  • 6.1 研究工作总结
  • 6.2 应用展望
  • 致谢
  • 参考文献
  • 个人简历 在读期间发表的学术论文与研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    离群数据挖掘在犯罪通讯痕迹发现中的应用
    下载Doc文档

    猜你喜欢