
论文摘要
据挖掘技术能够有效地处理大量数据信息的管理和利用的问题,并从中获得有关知识。由于保险行业的复杂性和重要性,开发保险业数据信息具有重要的学术价值和广阔的应用前景。数据挖掘技术作为分析处理数据的有效手段当前的发展已经日渐成熟并且已经应用到部分领域及部门。本论文以保险营销数据挖掘系统的分析、设计、研究与实现为主体,主要讨论基于保险营销数据仓库的数据挖掘技术的研究。以关联规则数据挖掘技术为基础,在关联规则众多算法中选择经典Apriori算法,从理论和样本数据应用两方面发现Apriori算法本身固有的候选集多、访问数据库效率低等一系列缺陷,采用FP_growth算法,并且说明针对Apriori的算法原理无法达到FP_growth算法性能和效率的优越。针对保险营销的具体数据情况和FP_growth的算法特点制定B/S结构的算法实现机制。最后总结了已经完成的工作和对未来研究工作的分析与展望。
论文目录
摘要Abstract1 绪论1.1 本课题的研究背景及研究意义1.1.1 研究背景1.1.2 研究意义1.2 数据挖掘技术在保险的应用1.2.1 国外保险营销数据挖掘应用概述1.2.2 国内数据挖掘在保险营销的应用现状1.3 本论文研究内容1.4 本文的结构及所做的工作2 保险行业概述2.1 保险概念与分类2.1.1 保险的定义2.1.2 保险的分类2.2 保险的作用2.3 保险的特点2.4 我国保险现状2.5 小结3 数据挖掘技术及应用3.1 数据挖掘定义概述3.2 知识发现3.3 数据挖掘技术3.3.1 数据挖掘任务3.3.2 数据挖掘模式3.3.3 数据挖掘技术分类3.3.3.1 统计分析类3.3.3.2 知识发现类3.3.3.3 其他数据挖掘技术3.4 数据挖掘的一般过程3.5 数据挖掘的其他应用和发展趋势3.5.1 数据挖掘的其他应用3.5.1.1 数据挖掘与供应链管理3.5.1.2 产品质量的保证3.5.1.3 风险评估和欺诈检查3.5.1.4 犯罪活动的侦察3.5.2 数据挖掘的发展趋势3.6 小结4 关联规则技术详述4.1 关联规则4.1.1 关联规则概述4.1.2 保险事务空间数学模型4.1.3 关联规则的分类4.2 Apriori 算法4.2.1 基本概念4.2.2 算法的基本思想4.2.2.1 连接4.2.2.2 剪枝4.2.3 核心算法4.2.4 算法性能的瓶颈4.3 Apriori 其他扩展算法4.3.1 AprioriTID 算法4.3.2 Partition 算法4.3.3 Sampling 算法4.3.4 DHP 算法4.3.5 DIC 算法4.3.6 并行挖掘算法4.3.7 增量式更新算法growth 挖掘算法'>4.4 关联规则的 FPgrowth 挖掘算法tree'>4.4.1 构建 FPtreetree 的挖掘算法(FPgrowth)'>4.4.2 FPtree 的挖掘算法(FPgrowth)4.5 算法比较4.6 小结5 关联规则挖掘在保险业营销的应用5.1 问题描述5.2 保险数据预处理5.3 预处理数据关联分析growth 算法比较应用'>5.3.1 Apriori 算法与 FPgrowth 算法比较应用5.3.1.1 Apriori 挖掘算法应用growth 挖掘算法应用'>5.3.1.2 FPgrowth 挖掘算法应用5.3.2 算法实现的性能比较和评估5.4 小结growth 算法实现及验证'>6 FPgrowth 算法实现及验证6.1 关联分析6.1.1 关联分析客户消费6.1.2 单维元素分析6.1.3 多维元素交叉关联分析6.2 数据仓库应用growth 算法'>6.3 实现 FPgrowth 算法6.4 基于B/S 的访问模式6.5 小结7 总结与展望7.1 结论7.2 未来的研究方向致谢参考文献攻读硕士学位期间学术发表论文
相关论文文献
标签:数据挖掘论文; 关联规则论文; 算法论文;