审计监测指标发现与提取技术研究与应用

审计监测指标发现与提取技术研究与应用

论文摘要

数据挖掘是机器学习领域重要的技术之一,也是知识发现的一个重要过程。其目的就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取或挖掘隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识。现有计算机审计方法零散,均是人工手动处理和分类,且社保审计监测指标的发现和提取工作也是人工手动进行,使得审计经验的共享程度比较低,为审计工作者带来了诸多不便。本文在总结数据挖掘技术的国内外研究现状和研究成果的基础上,介绍了数据挖掘相关技术和理论知识,特别是关联规则分析技术和聚类分析技术;针对现有社保审计词库的不足,使用新词的识别算法,给出了社保审计词库的动态更新过程;并在此基础之上,以社会保险审计方法集为实验数据集,针对聚类算法中经典k-均值算法的两大缺陷,首次给出了关联规则分析技术中最小规则覆盖集的概念,并提出了基于最小规则覆盖集的K-均值改进算法,有效地改善了聚类效果,并成功应用于审计监测指标发现和提取过程中,从而进一步研究社保审计监测指标的发现和提取方法;审计监测指标发现和提取系统也应运而生,为后期的审计工作奠定了良好的基础。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景及意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义
  • 1.2 国内外研究现状
  • 1.2.1 基于聚类的关联规则分析技术
  • 1.2.2 基于关联规则的聚类分析技术
  • 1.2.3 文本聚类分析技术
  • 1.2.4 关联规则分析技术
  • 1.3 论文组织结构
  • 1.3.1 论文主要研究内容
  • 1.3.2 论文内容安排
  • 第2章 数据挖掘相关理论
  • 2.1 数据挖掘技术
  • 2.2 关联规则分析技术
  • 2.3 聚类分析技术
  • 2.3.1 聚类分析技术
  • 2.3.2 聚类效果评估指数
  • 2.4 本章小结
  • 第3章 社保审计领域词库的动态更新
  • 3.1 社保审计领域词库构建
  • 3.2 社保审计领域词库动态更新过程
  • 3.3 社保领域新词识别算法
  • 3.4 本章小结
  • 第4章 审计监测指标的发现和提取
  • 4.1 k-均值算法及其局限性
  • 4.1.1 k-均值算法作为基础算法的原因
  • 4.1.2 k-均值算法的局限性
  • 4.2 基于最小规则覆盖集的 k-均值算法改进
  • 4.2.1 基于最小规则覆盖集的 k-均值改进算法
  • 4.2.2 改进算法举例
  • 4.3 审计监测指标发现和提取过程及实验分析
  • 4.3.1 实验数据集
  • 4.3.2 审计方法文本分词
  • 4.3.3 审计方法空间向量表示
  • 4.3.4 审计方法相似度函数定义
  • 4.3.5 关联规则分析
  • 4.3.6 聚类分析
  • 4.3.7 审计监测指标的发现与提取
  • 4.4 本章小结
  • 第5章 系统设计
  • 5.1 概要设计
  • 5.2 详细设计
  • 5.3 系统工作流程及模块功能设计
  • 5.3.1 审计方法导入模块
  • 5.3.2 审计方法分词模块
  • 5.3.3 词频统计模块
  • 5.3.4 审计方法聚类分析模块
  • 5.3.5 审计监测指标发现和提取模块
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].一种基于扩展加减覆盖集的隐写方法[J]. 电子学报 2014(06)
    • [2].基于相交覆盖集的最大化无线传感网寿命算法[J]. 仪表技术与传感器 2017(12)
    • [3].定西市安定区旱作马铃薯机械化垄播覆盖集雨节水栽培试验效果研究[J]. 农业机械 2019(12)
    • [4].求图的最小顶点覆盖集的一个近似算法[J]. 哈尔滨工业大学学报 2008(07)
    • [5].基于感应区域像素的无线传感器最小覆盖集近似算法[J]. 微电子学与计算机 2012(12)
    • [6].无线传感器网络最小覆盖集的贪婪近似算法[J]. 软件学报 2010(10)
    • [7].全膜覆盖集雨技术栽培玉米获取粮食丰收——贵州等低海拔少雨地带应用全膜覆盖栽培技术获取玉米高产[J]. 中国农业信息 2013(15)
    • [8].玉米全膜覆盖集雨技术[J]. 新农业 2012(13)
    • [9].旱地谷子垄膜覆盖集雨增产试验[J]. 山西水土保持科技 2011(04)
    • [10].机场噪声监测无线传感网络最小连通覆盖集研究[J]. 计算机与数字工程 2014(05)
    • [11].求一般图的最小顶点覆盖集问题的混合贪婪算法[J]. 科学技术与工程 2010(20)
    • [12].基于最小覆盖集的WSN数据聚集算法[J]. 计算机工程 2012(02)
    • [13].传感器网络中一种基于网格的密度控制算法[J]. 计算机应用研究 2009(06)
    • [14].基于覆盖集的突发污染水质监测点优化选址模型改进[J]. 中国给水排水 2017(17)
    • [15].旱作马铃薯双垄沟全膜覆盖集雨栽培技术[J]. 长江蔬菜 2010(07)
    • [16].有向传感器网络中基于概率感知模型的最小连通k覆盖集算法[J]. 计算机工程与科学 2008(12)
    • [17].基于最小覆盖集的高精度链路丢包率测量方法[J]. 电子与信息学报 2012(12)
    • [18].LSB Matching的嵌入效率分析[J]. 南京理工大学学报(自然科学版) 2008(04)
    • [19].基于遗传算法的无线传感器网络最小覆盖集算法[J]. 信阳师范学院学报(自然科学版) 2012(03)
    • [20].旱作覆盖集雨条件下梨树生长对土壤水热的响应研究[J]. 节水灌溉 2020(09)
    • [21].基于能耗均衡的WSN连通覆盖集构建算法[J]. 计算机工程 2011(18)
    • [22].玉米双垄面全膜覆盖集雨沟播栽培试验[J]. 农技服务 2015(05)
    • [23].黄土高原土壤风蚀区玉米起垄覆盖集水效应[J]. 农业工程学报 2009(04)
    • [24].基于类别覆盖集的改进蚁群算法研究[J]. 软件导刊 2017(03)
    • [25].广义Petersen图的最小点覆盖集[J]. 山西师范大学学报(自然科学版) 2014(01)
    • [26].高原山旱地马铃薯双垄全膜覆盖集雨高效栽培技术要点[J]. 青海科技 2009(02)
    • [27].白菜花旱作双垄面全膜覆盖集雨抑蒸沟播技术[J]. 北方园艺 2008(08)
    • [28].湟源县旱地马铃薯双垄全膜覆盖集雨栽培技术探讨[J]. 青海农技推广 2009(03)
    • [29].旱地马铃薯双垄全膜覆盖集雨栽培技术[J]. 农村实用科技信息 2011(07)
    • [30].旱地双垄全膜覆盖集雨马铃薯栽培技术——以青海同仁地区为例[J]. 中国园艺文摘 2011(12)

    标签:;  ;  ;  ;  ;  

    审计监测指标发现与提取技术研究与应用
    下载Doc文档

    猜你喜欢