论文摘要
随着现代通讯技术的发展,通讯工具已经成为人们日常生活与工作的得力助手,通讯活动也成为了现代生活的有机组成。在公安侦查实践中,人们发现许多犯罪活动中伴随着与犯罪关联的通讯活动,对这些活动的分析调查对公安侦查有很大帮助,公安侦查人员将与犯罪相关联的这些通讯活动称为犯罪通讯痕迹。由于犯罪分子反侦查意识不断提高,传统的社会调查方法获取犯罪通讯痕迹已经变得越来越困难。然而事实上,同普通通讯信息一样,犯罪通讯痕迹信息在其发生的那一刻起,就已经存在于相应通讯公司的信息数据库中,利用数据分析技术,将其从众多通讯信息中分离出来,将会为公安侦查开辟一条新途径。数据挖掘是从大量数据中获取有用信息的、并已经得到广泛应用的成熟的综合数据分析技术,本文分析了数据挖掘的主要过程与主要方法,并结合犯罪通讯痕迹的特点,提出使用离群数据挖掘方法分离犯罪通讯痕迹的方向,并随后对离群数据挖掘的主要方法进行了详细分析,结合犯罪通讯痕迹数据挖掘的独特特点,对相应的离群数据挖掘算法进行了改进,提出了主属性离群阀值、离群关系双K系数离群数据挖掘算法。本文随后结合相关公安侦查工作实践,提出了对通讯活动总体特征进行描述的具体方法,并使用SQL2005,根据离群关系双K系数算法,从某公司的通讯数据信息库中提取了实验数据,进行了数据的相应处理与转换,对犯罪通讯痕迹的离群数据挖掘予以编程实现,并通过对相关输出结果的专家分析,验证了算法的有效性,实现了将离群数据挖掘方法应用到犯罪通讯痕迹发现中的应用目标,本文最后对犯罪通讯痕迹数据挖掘未来研究方向和应用前景进行了展望。
论文目录
摘要ABSTRACT第1章 绪论1.1 研究的背景1.2 课题的提出1.3 主要技术1.4 本文的主要研究内容第2章 数据挖掘理论2.1 数据仓库2.1.1 数据仓库的概念2.1.2 数据仓库的体系结构2.1.3 数据集市2.2 数据挖掘2.2.1 数据挖掘的概念2.2.2 数据挖掘的体系结构与一般过程2.2.3 数据挖掘的主要方法2.2.4 数据挖掘工具第3章 离群数据挖掘方法3.1 离群点的定义3.2 离群点发现方法3.2.1 基于统计的离群点检测3.2.2 基于距离的离群点检测3.2.3 基于偏离的离群点检测3.2.4 基于密度的离群点检测第4章 基于密度的离群数据挖掘算法的改进4.1 LOF算法存在的主要问题4.2 LOF的改进算法4.2.1 局部孤立系数算法4.2.2 K-距离因子算法4.2.3 增强的K-距离因子算法4.3 离群关系双K系数算法4.3.1 犯罪通讯痕迹数据挖掘特点分析4.3.2 离群关系双K系数数据挖掘算法第5章 犯罪通讯痕迹离群数据挖掘的实现5.1 系统框架5.2 数据集市的建立5.2.1 数据仓库的建立5.2.2 数据集市的建立过程5.3 离群关系双K系数犯罪通讯痕迹数据挖掘实现5.3.1 离群候选集对象通讯统计信息表的建立5.3.2 数据标准化处理5.3.3 离群关系双K系数挖掘5.4 下步工作方向第6章 总结与展望6.1 研究工作总结6.2 应用展望致谢参考文献个人简历 在读期间发表的学术论文与研究成果
相关论文文献
标签:数据挖掘论文; 数据仓库论文; 离群点论文; 犯罪通讯痕迹论文;