论文摘要
关联规则挖掘是数据挖掘领域中一个重要研究内容。传统的关联规则挖掘算法大都基于支持度-置信度框架,利用支持度去除非频繁项集,利用置信度得到较为有效的关联规则。对支持度分布严重倾斜的数据集挖掘时,人们发现现有算法无法选择合适的支持度阈值。若将最小支持度设置较高,会遗漏支持度较低但令人感兴趣的规则,若设置较低,则挖掘结果会含有大量虚假规则,对用户没有实际意义。本论文针对上述问题,围绕如何得到可信有效的关联规则展开研究,创新点和主要工作如下:1.提出可信关联规则的概念可信关联规则中各个项目的支持度处于同一数量级,一个项目的出现很强的暗示了规则中其他项目也会出现,即规则中的各个项目在很大程度上是同现的。挖掘这种规则时,可以忽略支持度阈值,因此可同时得到频繁模式和非频繁模式。对于可信关联规则的兴趣度量,本文提出基于可信度的度量,并引入基于距离测度的度量及h-置信度等。实验结果表明,可信关联规则在很多数据集中都会存在,其可信程度远远大于传统的关联规则,可广泛应用到诸多领域。2.提出基于极大团挖掘可信关联规则的MaxCliqueMining算法MaxCliqueMining算法采用邻接矩阵产生2-项可信集,不需要对数据库进行多次扫描,就能利用极大团思想产生所有可信关联规则,提高时间性能。该算法可以挖掘基于可信度、提升度、余弦度量以及相关度度量的可信关联规则,对于不同度量,算法只在生成2-项可信集时有所区别,后续挖掘过程完全一致。实验结果表明,本算法在倾斜支持度分布的数据集中挖掘可信关联规则具有较高的效率和准确性。3.提出统一挖掘超团模式和极大超团模式的HHCP-growth算法超团模式和极大超团模式都是基于h-置信度度量的可信关联规则的特定类型。挖掘两种模式的标准算法是完全不同的。本文提出基于FP-tree的HHCP-growth算法统一了两种模式的挖掘。算法采用了递归挖掘思想,无需保存大量候选项集。除了应用传统的最小支持度剪枝策略外,还引入最大支持度剪枝、项目自剪枝以及剩余项目剪枝等策略,减少遍历和递归的次数。本文证明了剪枝策略的有效性和算法的正确性。实验结果表明,HHCP-growth算法与传统的超团模式挖掘算法和极大超团模式挖掘算法相比,具有更高的效率,尤其在大数据集或低支持度条件下更为显著。4.制作并发布可作为告警关联分析和研究使用的标准告警数据集采集了某省移动公司GPRS网络管理系统及某设备生产商模拟网管理系统部分时段的告警数据。这些真实数据经过预处理,去除噪声和敏感信息后,被转换为可进行直接挖掘的标准数据格式。告警数据集在网站上提供免费下载,可作为告警关联分析和研究使用的标准数据集。
论文目录
相关论文文献
- [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
- [2].无题[J]. 书城 2020(04)
- [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
- [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
- [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
- [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
- [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
- [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
- [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
- [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
- [11].关联性·横与竖[J]. 美术界 2019(10)
- [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
- [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
- [14].关联性·黑与白[J]. 美术界 2018(08)
- [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
- [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
- [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
- [18].连连看[J]. 启蒙(0-3岁) 2008(02)
- [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
- [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
- [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
- [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
- [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
- [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
- [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
- [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
- [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
- [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
- [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
- [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)