论文题目: 面向中观审计的规则发现算法研究
论文类型: 博士论文
论文专业: 计算机应用技术
作者: 陈耿
导师: 孙志挥
关键词: 中观审计,数据挖掘,关联规则,频繁项集,分布式关联规则,关联规则更新
文献来源: 东南大学
发表年度: 2005
论文摘要: 目前,我国政府部门为了规范市场经济秩序,防范各类经济风险,十分重视并积极开展各类审计工作,提出了对重点资金、重点领域、重点项目的审计监督。但是,从庞大的数据库系统中迅速地提取出有用的审计信息成为当前审计工作面临的严峻挑战,这就更加要求从多个层面探索更有效的审计思路、新方法和新技术。本论文研究工作就是试图将中观审计理论与数据挖掘等计算技术相结合,从行业中各个单位的数据库系统中提取出中观(行业)审计假设与关联模式,用以指导中观审计工作的深入开展,并在此基础上积极探索审计智能化、自动化的理论与技术。本文的研究工作的创新性主要体现在以下几个方面:(1)从中观审计检测的实际需要出发,提出了非对等结构的分布式数据库环境下关联规则挖掘的原型系统AuditMiner体系结构,即由局部站点和全局站点协同完成关联规则的挖掘任务。(2)提出了面向中观审计的基于二进制形式的候选频繁项目集生成和相应的计算支持数算法B-Gen,用以降低生成频繁项集的实现难度,将该算法与Apriori、FUP、FDM等算法相结合,提出了BApriori、BFUP和FDM等算法,可以显著提高关联规则的生成效率。(3)鉴于大数据集环境下的关联规则发现日益受到重视,分布式关联规则发现是解决这一问题的有效方法。针对非对等结构分布式数据库环境,本文提出了相应的算法GFDA,算法可以高效地对分布环境下的数据进行关联规则发现。(4)在中观审计检测中大量遇到规则增量更新问题。本文在DW.Cheung等人提出的FUP算法的基础上,引入候选支持度、次频繁项集和支持数上界等概念,提出了增量式关联规则发现算法IFUP;进一步针对分布式环境下的关联规则的增量更新问题,提出更新算法LUDA和GUDA以及更新算法LUDA2和GUDA2。这些更新算法能够充分利用已挖掘的结果,产生较少数量的候选频繁项目集,通信代价低,算法效率较高。(5)将Benford法则应用于发现异常交易,引入差异度概念与全局关联规则进行比对获取异常模式,可以有效提高规则的审计兴趣度。(6)研制以海关为审计主体的、面向中观审计检测的、分布式审计关联规则挖掘原型系统AuditMiner,用以验证论文中提出的各算法的适用性和有效性。
论文目录:
摘要
Abstract
第一章 引言
1.1 课题研究的背景与意义
1.2 国内外研究现状
1.2.1 关联规则挖掘算法研究现状
1.2.2 计算机审计的应用与研究现状
1.2.3 中观审计研究现状
1.3 本文主要研究内容
1.4 本文主要研究成果
1.5 本文的组织
第二章 审计信息系统中知识发现研究
2.1 概述
2.2 相关理论研究
2.3 中观审计模型
2.3.1 审计对象信息系统分析
2.3.2 面向中观审计的规则发现模型
2.4 面向中观审计的数据挖掘系统AuditMiner
2.4.1 海关数据挖掘模型
2.4.2 AuditMiner 体系结构
2.5 本章小结
第三章 面向中观审计的关联规则挖掘算法研究
3.1 相关研究
3.2 基本概念与理论
3.2.1 关联规则的概念
3.2.2 提取关联规则的算法与理论基础
3.2.3 Apriori 算法分析
3.3 基于二进制编码的关联规则挖掘算法BApriori
3.3.1 有关的性质
3.3.2 算法描述
3.3.3 算法实现与性能测试
3.4 基于二进制编码的关联规则挖掘更新算法BFUP
3.4.1 问题描述
3.4.2 算法思想
3.4.3 算法描述
3.4.4 算法分析与性能测试
3.5 基于二进制编码的关联规则分布挖掘算法BFDM
3.5.1 概述
3.5.2 算法思想
3.5.3 算法描述
3.5.4 算法分析与性能测试
3.6 本章小结
第四章 面向中观审计的关联规则分布式挖掘算法研究
4.1 相关研究
4.2 基本概念与理论
4.2.1 问题描述
4.2.2 有关性质研究
4.3 布尔关联规则的分布挖掘算法GFDA
4.3.1 算法思想
4.3.2 算法描述
4.3.3 算法分析与性能测试
4.4 本章小结
第五章 面向中观审计的关联规则更新算法研究
5.1 关联规则更新算法研究现状
5.2 数据库规模增加时关联规则的更新
5.2.1 问题描述
5.2.2 算法思想
5.2.3 算法描述
5.2.4 算法实验与性能分析
5.3 数据库规模增加时分布关联规则的更新
5.3.1 局部频繁项集的更新算法LUDA
5.3.2 全局频繁项集的更新算法GUDA
5.3.3 算法分析与性能测试
5.4 最小支持度变化后分布关联规则的更新
5.4.1 局部频繁项集的更新算法LUDA2
5.4.2 全局频繁项集的更新算法GUDA2
5.4.3 算法实验与性能分析
5.5 本章小结
第六章 基于Benford 法则的审计规则发现研究
6.1 概述
6.2 Benford 法则
6.2.1 相关概念
6.2.2 理论证明
6.3 差异度
6.4 算法描述
6.5 算法实验与结论分析
6 6 本章小结
第七章 结束语
7.1 本文总结
7.2 进一步的研究工作
致谢
参考文献
附录Ⅰ读博期间发表(含已录用)的论文
附录Ⅱ读博期间参与的科研项目
发布时间: 2007-06-11
参考文献
- [1].面向物联网的RFID标签识别算法研究[D]. 付钰.吉林大学2018
- [2].城市公交系统模型与算法研究[D]. 于滨.大连理工大学2006
- [3].粒子群优化算法的理论分析与应用研究[D]. 李宁.华中科技大学2006
- [4].结构化稀疏数据重构的若干理论及算法研究[D]. 王文东.西南大学2017
- [5].基于维数约简的无监督聚类算法研究[D]. 杜世强.兰州大学2017
- [6].基于雅克比矩阵的软划分聚类算法分析[D]. 超木日力格.北京交通大学2017
- [7].对象关系数据库中若干关键技术的研究[D]. 阳国贵.中国人民解放军国防科学技术大学2000
相关论文
- [1].现代审计功能拓展研究[D]. 陈孝.西南财经大学2006
- [2].我国国家审计管理机制创新研究[D]. 胡志勇.南昌大学2006
- [3].管理审计评价标准研究[D]. 郑石桥.上海财经大学2001
- [4].风险导向审计模式下风险偏好的影响研究[D]. 段宏.西南交通大学2006
- [5].审计行为及其经济分析研究[D]. 刘峰.西南交通大学2006
- [6].基于受托责任理论的内部审计若干问题研究[D]. 瞿曲.厦门大学2006
- [7].基于推理的访问控制与审计技术研究[D]. 严和平.复旦大学2006
- [8].经济权力审计控制效果研究[D]. 董延安.西南财经大学2007
- [9].管理舞弊控制与审计质量[D]. 刘学华.西南财经大学2007
- [10].安全强审计模型研究[D]. 史兴键.西北工业大学2006