序列关联挖掘算法研究及在水环境安全中的应用

序列关联挖掘算法研究及在水环境安全中的应用

论文摘要

数据挖掘技术是从大量的﹑不完全的、有噪声的﹑模糊的、随机的数据中,提取隐含在其中的﹑事先未知的﹑潜在有用信息的一门新兴技术。关联规则分析是数据挖掘中最重要的研究内容之一,旨在从大量的数据中或对象间抽取关联性知识,进而揭示数据或对象间的依赖关系。随着信息化水平的不断提高和监测手段的进步,在三峡库区水环境安全信息数据库中积累了大量的监测数据,如何充分利用这些数据来为三峡库区水环境安全以及国家的环保事业服务,是当前重点关注的问题。水环境安全数据中蕴藏着潜在的关联性知识,这些数据适合用关联规则分析方法来学习和认识;同时,水环境安全数据在类型特征上有其特殊性。如何运用先进的数据分析技术对其进行探索性研究,挖掘潜在的有价值的模式,这无论在理论研究还是实践指导上都具有重要的意义。本文针对上述问题,提出一种基于约束的序列模式挖掘算法(Constraint-based Sequential Pattern Mining,简称CSPM)。论文主要研究内容如下:①分析了数据挖掘技术、关联规则分析的基本理论和主要方法,总结了数据挖掘和关联分析的研究现状和研究方向。介绍了关联规则分析的经典方法Apriori算法的基本思想和算法步骤,并分析了Apriori算法的主要特点。②对多维量化数据和序列数据下的关联规则分析问题进行了分析和探讨。介绍了序列模式的定义和描述方法,提出了基于约束的序列模式挖掘算法,阐述了算法的步骤和关键问题。该算法改进了候选序列匹配产生的方法,并引入属性约束和时限约束来产生序列模式,提高了序列模式对序列知识的描述能力,改善了算法性能。③将基于约束的序列模式挖掘算法应用到三峡库区水环境安全的水质监测数据中。介绍了挖掘流程、数据库的建立和数据预处理过程;用本文提出的算法挖掘三峡库区水环境安全监测时序模式,并结合三峡库区水环境安全领域知识,对模式结果进行了说明和分析,验证了算法的有效性;探讨了序列关联挖掘在三峡库区水环境安全预警决策中的应用。

论文目录

  • 摘要
  • ABSTRACT
  • 1 绪论
  • 1.1 研究背景及意义
  • 1.1.1 研究背景
  • 1.1.2 研究意义和目标
  • 1.2 研究现状
  • 1.2.1 数据挖掘技术的研究现状
  • 1.2.2 关联规则分析和序列数据挖掘的研究现状
  • 1.3 论文组织结构
  • 2 数据挖掘与关联规则分析
  • 2.1 数据挖掘技术
  • 2.1.1 数据挖掘的概念
  • 2.1.2 数据挖掘的主要任务
  • 2.1.3 数据挖掘的过程
  • 2.1.4 数据挖掘的研究方向
  • 2.2 关联规则分析
  • 2.2.1 关联规则的概念
  • 2.2.2 Apriori 算法
  • 2.2.3 多维量化关联分析
  • 2.3 序列模式分析概述
  • 2.3.1 序列关联模式问题的提出
  • 2.3.2 序列模式挖掘经典方法
  • 2.4 本章小结
  • 3 基于约束的序列模式挖掘方法
  • 3.1 序列模式定义
  • 3.2 序列模式挖掘算法
  • 3.1.1 基于约束的序列模式挖掘算法
  • 3.1.2 CSMP 算法综述
  • 3.3 序列模式挖掘算法的关键问题
  • 3.3.1 候选序列产生
  • 3.3.2 候选剪枝
  • 3.3.3 约束条件
  • 3.3.4 支持度计数
  • 3.4 本章小结
  • 4 三峡库区水环境安全的序列模式挖掘
  • 4.1 挖掘流程
  • 4.2 数据选择和预处理
  • 4.2.1 数据选择
  • 4.2.2 数据库表建立
  • 4.2.3 数据预处理
  • 4.3 挖掘结果及性能分析
  • 4.3.1 挖掘结果
  • 4.3.2 算法性能分析
  • 4.4 序列关联挖掘在水环境安全预警决策体系中的应用
  • 4.4.1 三峡库区水环境安全预警决策项目概述
  • 4.4.2 关联挖掘在预警决策体系中的应用探讨
  • 4.5 本章小结
  • 5 总结
  • 5.1 工作总结
  • 5.2 研究展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    • [1].算法:一种新的权力形态[J]. 治理现代化研究 2020(01)
    • [2].算法决策规制——以算法“解释权”为中心[J]. 现代法学 2020(01)
    • [3].面向宏观基本图的多模式交通路网分区算法[J]. 工业工程 2020(01)
    • [4].算法中的道德物化及问题反思[J]. 大连理工大学学报(社会科学版) 2020(01)
    • [5].算法解释请求权及其权利范畴研究[J]. 甘肃政法学院学报 2020(01)
    • [6].算法新闻的公共性建构研究——基于行动者网络理论的视角[J]. 人民论坛·学术前沿 2020(01)
    • [7].算法的法律性质:言论、商业秘密还是正当程序?[J]. 比较法研究 2020(02)
    • [8].关键词批评视野中的算法文化及其阈限性[J]. 学习与实践 2020(02)
    • [9].掌控还是被掌控——大数据时代有关算法分发的忧患与反思[J]. 新媒体研究 2020(04)
    • [10].美国算法治理政策与实施进路[J]. 环球法律评论 2020(03)
    • [11].算法解释权:科技与法律的双重视角[J]. 苏州大学学报(哲学社会科学版) 2020(02)
    • [12].大数据算法决策的问责与对策研究[J]. 现代情报 2020(06)
    • [13].大数据时代算法歧视的风险防控和法律规制[J]. 河南牧业经济学院学报 2020(02)
    • [14].风险防范下算法的监管路径研究[J]. 审计观察 2019(01)
    • [15].模糊的算法伦理水平——基于传媒业269名算法工程师的实证研究[J]. 新闻大学 2020(05)
    • [16].算法推荐新闻对用户的影响及对策[J]. 新媒体研究 2020(10)
    • [17].如何加强对算法的治理[J]. 国家治理 2020(27)
    • [18].“后真相”背后的算法权力及其公法规制路径[J]. 行政法学研究 2020(04)
    • [19].算法规制的谱系[J]. 中国法学 2020(03)
    • [20].论算法排他权:破除算法偏见的路径选择[J]. 政治与法律 2020(08)
    • [21].政务算法与公共价值:内涵、意义与问题[J]. 国家治理 2020(32)
    • [22].算法的法律规制研究[J]. 上海商业 2020(09)
    • [23].新闻算法分发对隐私权的冲击及规制[J]. 青年记者 2020(27)
    • [24].算法如何平等:算法歧视审查机制的建立[J]. 南海法学 2020(02)
    • [25].蚁群算法在文字识别中的应用研究[J]. 信息与电脑(理论版) 2019(22)
    • [26].大数据聚类算法研究[J]. 无线互联科技 2018(04)
    • [27].RSA算法的改进研究[J]. 计算机与网络 2018(14)
    • [28].智能时代的新内容革命[J]. 国际新闻界 2018(06)
    • [29].改进的负载均衡RSA算法[J]. 电脑知识与技术 2018(25)
    • [30].基于深度学习的视觉跟踪算法研究综述[J]. 计算机科学 2017(S1)

    标签:;  ;  ;  ;  ;  

    序列关联挖掘算法研究及在水环境安全中的应用
    下载Doc文档

    猜你喜欢