关联规则挖掘在交通事故成因分析中的应用

关联规则挖掘在交通事故成因分析中的应用

论文摘要

进入21世纪,随着汽车保有量的增加,道路交通事故的频繁发生已日益成为一个严重的社会问题。当然,交通事故的成因是多方面的,在大量实际的道路交通安全事故属性中隐藏着某些潜在的规律,如果我们能够对这些数据进行科学地分析并挖掘出其内在的联系,那么相关部门在制定新的法律法规来改进交通安全现状做出决策时就有依可据了。交通事故也展现出多样性与复杂性,这就意味着,传统意义上的数据分析、数据处理工具、方式和方法已完全不能适应时代的要求。数据挖掘(DataMining)可以定义为:从海量的未知数据中提取或挖掘出知识,从技术层面上来说,关联规则是现阶段数据挖掘的最重要的方法。关联规则反映了事物之间的关联性和相互依存性[1],是指在数据集中支持度(Support)、置信度(Confidence)分别满足给定值(阈值)的规则。Apriori算法是关联规则挖掘的经典算法,该算法中蕴含的一条重要性质:“一个频繁项集的每一非空子集均应是频繁的”。通过专业的知识与技术,关联规则可以用来对数据进行分析,给出规则预测,从而找出它们之间内在的因果关系,而从海量的数据中寻找到数据间的关联关系对于决策分析是非常有价值的。采用数据挖掘手段可以从真实的交通事故案例数据库中搜索到有价值的信息,不断地组合影响交通事故案例诱因可以发现,这些因素之间存在着某种隐藏的规律。影响交通事故发生的因素一般是有联系的,如果通过人工调控,使这些关联因素中其中一些因素削弱或消失,则可以在一定程度上预防和减少交通事故的发生。由于道路交通安全事故诱发因素的复杂性,经典的数据挖掘Apriori算法并不适合对非单一维的规则挖掘,因此需要扩展。本文结合实际问题,对我们所研究的问题进行简化的同时设计了一套改进的Apriori算法,且支持多维度的关联规则挖掘,由于引入多维属性,因此挖掘出来的规则将更具有实用性和建议性。在多维度的数据库中对关联规则的挖掘将每个维当作一个谓词,可以更详细描述出一个事实。在挖掘所需信息时,需要在海量数据库中搜索频繁子集。在多层次多维度数据模型中,搜索频繁子集需要对每一层设定一个大小合适的最小支持度,因此在实际的操作中比较繁琐,因此可以绕个弯子来简化操作。方法是对规则进行分析之前我们先任选一个特定的层次作关联分析并排除其它层次的分析,因此这个问题就简化成了单层的规则分析。例如我们要对事故发生地点进行挖掘,选择县级公路层作为关联对象,其余的维度也这样选择。这样做问题就简化了,也得到了我们对多维度多层次的道路安全交通事故的数据挖掘的目的。本文作者针对道路交通事故这一社会性问题加以研究,对大家比较熟悉的单维单层Apriori算法加以改进;给出了交通事故常用属性的描述;道路交通事故属性的组织建模采取全星型连接数据模型;将大量纷繁芜杂的交通事故数据源组织为可进行挖掘的属性信息,以利于挖掘出它们之间各种复杂关系;我们着重描述了对真实交通事故数据的建模,并对研究对象设计改进的Apriori算法。最后我们在对数据库上的数据进行关联挖掘,导出影响道路交通安全事故因素关系的关联规则。本文对现实交通事故数据进行了合理的建模,并对这些数据进行关联规则挖掘,在理论和实际上都证明了关联规则挖掘在交通事故数据的分析和决策上具有使用价值。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 论文选题背景和目的
  • 1.2 国内外关于交通事故致因的研究状况
  • 1.2.1 国内研究状况
  • 1.2.2 国外研究状况
  • 1.3 相关工作介绍
  • 1.3.1 本文内容提要
  • 1.3.2 本文所做的工作如下
  • 1.4 文章结构
  • 第二章 数据挖掘基础
  • 2.1 数据挖掘概述
  • 2.1.1 数据挖掘的基本概念
  • 2.1.2 数据挖掘方法
  • 2.2 数据挖掘的功能
  • 2.3 数据挖掘技术对于交通领域的重要意义
  • 第三章 数据挖掘技术中关联规则理论
  • 3.1 关联规则
  • 3.1.1 形式化定义
  • 3.1.2 支持度(Support)
  • 3.1.3 置信度(Confidence)
  • 3.2 正负相关关联规则和强弱关联规则
  • 3.3 对关联规则进行分类以及对其进行抽取
  • 3.4 关联规则算法
  • 3.5 多视角关联规则
  • 3.5.1 简单的一层规则
  • 3.5.2 关联规则的多维挖掘方法
  • 3.6 Apriori算法的改进以扩充到多维模型中
  • 3.7 评价关联规则
  • 第四章 交通安全事故中关联规则的数据挖掘建模
  • 4.1 造成交通事故成的因素分析
  • 4.1.1 交通事故的法律定义和种类
  • 4.1.2 诱发交通事故的因素论
  • 4.1.3 交通安全事故的诱发因素的研究方法
  • 4.2 多维(非单一谓词)数据的模型
  • 4.3 道路交通安全事故中诱发因素的形式化属性定义
  • 4.4 对道路交通安全事故诱发因素的数据模型
  • 第五章 道路交通安全事故案例数据库中诱因的关联规则挖掘
  • 5.1 改进的Apriori算法
  • 5.1.1 数据集的采集与准备
  • 5.1.2 挖掘关联规则的主要步骤和方法
  • 5.2 实验分析
  • 5.2.1 使用Weka进行实验
  • 5.2.2 评价并优化道路交通安全事故的关联规则
  • 5.2.3 附加约束条件的改进算法
  • 5.2.4 结论
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    • [1].论关联企业的法律识别[J]. 晋阳学刊 2020(01)
    • [2].无题[J]. 书城 2020(04)
    • [3].正式与非正式政治关联对企业的差异化影响[J]. 中国商论 2019(06)
    • [4].政治关联对企业的影响研究综述[J]. 中国经贸导刊(中) 2019(09)
    • [5].独立学院大学生贫困程度与就业竞争力的关联度研究[J]. 智库时代 2018(29)
    • [6].银行关联如何缓解融资约束:直接机制还是间接机制[J]. 当代财经 2017(05)
    • [7].数据挖掘的关联分析及在道路交通事故中的应用[J]. 信息与电脑(理论版) 2017(10)
    • [8].从“人”与“神”的关联看文化的意义[J]. 教育文化论坛 2017(05)
    • [9].企业形成机理与政治关联的关系[J]. 商 2016(24)
    • [10].会计处理背景下关联交易非关联化问题的治理[J]. 经济视角(上旬刊) 2015(06)
    • [11].关联性·横与竖[J]. 美术界 2019(10)
    • [12].浅论单句中的关联词语[J]. 中国校外教育(理论) 2008(S1)
    • [13].从关联理论看话语冲突——以恋人间话语冲突为例[J]. 江苏外语教学研究 2017(04)
    • [14].关联性·黑与白[J]. 美术界 2018(08)
    • [15].零售药店关联销售的利与弊[J]. 现代养生 2014(12)
    • [16].“涉及到”的说法对吗?[J]. 中华活页文选(高一年级) 2012(09)
    • [17].找找有关联的东西[J]. 启蒙(0-3岁) 2010(08)
    • [18].连连看[J]. 启蒙(0-3岁) 2008(02)
    • [19].价格关联协议的基本类型及其竞争法控制初探[J]. 西部法学评论 2019(06)
    • [20].基于制衡股东角度规范关联交易的思考[J]. 会计师 2019(24)
    • [21].关联企业授信贷前尽职调查探析[J]. 中国商论 2020(07)
    • [22].政治关联会影响券商的经济后果吗?[J]. 投资研究 2019(11)
    • [23].政治关联、制度环境与企业绩效关系研究[J]. 市场研究 2020(04)
    • [24].基于关联规则的数据挖掘的研究与应用[J]. 粘接 2020(05)
    • [25].标准相对关联度的定义及基础算法[J]. 标准科学 2020(07)
    • [26].金融控股公司关联交易监管方略谈[J]. 经济师 2020(09)
    • [27].“民族—宗教—政治”负面关联性的内在逻辑剖析——基于反对“三股势力”的视角[J]. 中南民族大学学报(人文社会科学版) 2019(01)
    • [28].中国现当代文学研究中的“强行关联法”指谬[J]. 文艺研究 2018(04)
    • [29].关联理论及其在翻译当中的应用[J]. 海外英语 2018(07)
    • [30].反腐败影响了企业捐赠吗?——基于政治关联视角的微观解释[J]. 中央财经大学学报 2017(01)

    标签:;  ;  ;  ;  

    关联规则挖掘在交通事故成因分析中的应用
    下载Doc文档

    猜你喜欢