基于决策树分类算法和Apriori算法的数据挖掘在电信行业的应用研究

基于决策树分类算法和Apriori算法的数据挖掘在电信行业的应用研究

论文摘要

电信企业在发展,电信市场在规范,2008年2月信息产业部出台规定:本地电信资费套餐不能超过10种,而目前运营商们的套餐种类繁多,常高达几十种甚至上百种,不便于消费者的选择和使用。套餐作为电信企业的重要产品,是企业为用户提供服务的载体,对套餐的分析直接受到企业的重视。为减少带给企业的风险,套餐在新推出前都要进行预演,目前预演大都采用“模拟出帐法”,其所选择的用户样本具有盲目性,无法预知“套餐的目标用户群是哪些”、“套餐的预期月收入是多少”的问题,用户样本与套餐本身不相关,得出的总量类指标因而常不具有价值。本文采用“逆向思维”,先把用户按品牌分群,在分群的基础上,使用关联规则算法,发现群中用户的消费规律,根据规律再制定相应套餐。使得新套餐一推出时就能符合细分市场的规律,在套餐总数受限的前提下,能有效避免盲目性,减小企业风险。目前国内的运营商已经基本完成了企业级数据仓库的设计和建设,本文正是建立在已有的数据仓库之上,导出部分经营分析数据,经过数据选择、预处理、转换,建成一个面向特定主题的“小数据仓库”,即数据集市,同时数据集市在一定程度上缓解了访问数据仓库的瓶颈。本文研究了数据仓库和数据挖掘的相关知识,重点研究了决策树分类算法中的ID3算法和关联规则中的Apriori算法,了解了套餐制定的相关信息,采用Weka这个开放式数据挖掘工具对营帐数据进行了挖掘,发现了短信、市话、长途、增值业务间的关系,对现有套餐进行了修改。本文为套餐的制定提供了科学依据,打开了套餐制定的新局面。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 论文背景
  • 1.2 论文目标
  • 1.3 论文所做工作
  • 1.4 论文组织结构
  • 第2章 数据仓库与数据挖掘
  • 2.1 数据仓库
  • 2.1.1 数据仓库概念
  • 2.1.2 数据仓库类型
  • 2.1.3 数据仓库与数据挖掘的关系
  • 2.2 数据挖掘
  • 2.2.1 数据挖掘的定义和特点
  • 2.2.2 数据挖掘的主要功能
  • 2.2.3 数据挖掘的应用
  • 2.2.4 数据挖掘的方法及工具
  • 2.2.5 数据挖掘的实施
  • 2.3 本章小结
  • 第3章 决策树分类算法和关联规则算法研究
  • 3.1 决策树分类方法介绍
  • 3.2 ID3算法介绍
  • 3.3 关联规则介绍
  • 3.3.1 关联规则研究现状
  • 3.3.2 关联规则的形式化描述
  • 3.4 Apriori算法
  • 3.4.1 Apriori算法简介
  • 3.4.2 Apriori算法实例说明
  • 3.5 本章小结
  • 第4章 电信业套餐制定模型的建立和应用
  • 4.1 基本概念
  • 4.1.1 套餐
  • 4.1.2 套餐分析
  • 4.2 商业理解
  • 4.3 研究任务的可行性分析
  • 4.3.1 数据可行性分析
  • 4.3.2 挖掘工具可行性分析
  • 4.4 研究任务的必要性
  • 4.4.1 以往套餐制定的缺点
  • 4.4.2 新套餐分析法的优势
  • 4.4.3 套餐预演与现在方法的关系
  • 4.5 挖掘过程
  • 4.5.1 数据挖掘流程
  • 4.5.2 数据准备
  • 4.5.3 数据选择
  • 4.5.4 数据清洗
  • 4.5.5 数据转换
  • 4.5.6 数据离散化
  • 4.6 挖掘结果
  • 4.6.1 ID3算法分群
  • 4.6.2 关联规则挖掘呼叫模式
  • 4.6.3 结合挖掘结果分析实际使用套餐的情况
  • 4.6.4 改进措施
  • 4.6.5 按改进的套餐进行模拟测试
  • 4.7 小结
  • 第五章 结束语
  • 5.1 总结
  • 5.2 进一步的研究工作
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].基于Apriori算法的船用物联网多来源数据深度挖掘方法[J]. 舰船科学技术 2019(24)
    • [2].基于二维云模型和Apriori算法的围岩稳定性分级研究[J]. 铁道学报 2020(06)
    • [3].基于Apriori关联分析的煤层气压裂效果主控因素识别[J]. 油气藏评价与开发 2020(04)
    • [4].基于Apriori算法综合管廊火灾识别预警系统[J]. 消防科学与技术 2020(04)
    • [5].基于Apriori算法分析米面制品营养标签使用关联规则[J]. 食品安全质量检测学报 2020(19)
    • [6].基于Apriori的科研考核信息的关联性分析[J]. 辽宁高职学报 2020(10)
    • [7].基于改进Apriori算法的地面空调间歇故障预测[J]. 计算机应用 2016(12)
    • [8].基于关联规则Apriori算法的心肺性职业病病情分析及预测[J]. 中国数字医学 2017(04)
    • [9].基于Apriori算法校园网络安全系统设计[J]. 网络安全技术与应用 2017(03)
    • [10].基于Apriori算法的慢性阻塞性肺疾病超限住院费用关联规则数据挖掘[J]. 中国慢性病预防与控制 2017(04)
    • [11].Apriori算法在无纸化考试系统中的应用[J]. 电脑编程技巧与维护 2016(10)
    • [12].Apriori算法在无纸化考试系统中的应用和改进[J]. 周口师范学院学报 2015(02)
    • [13].基于关联规则Apriori算法的真实世界中结肠恶性肿瘤患者的中西药联合应用特征研究[J]. 中药药理与临床 2019(05)
    • [14].最小支持度为区间值的加权Apriori算法[J]. 辽宁工程技术大学学报(自然科学版) 2016(12)
    • [15].基于关联规则Apriori算法的真实世界复方苦参注射液治疗恶性肿瘤西药联合应用特征研究[J]. 中南药学 2016(12)
    • [16].基于Apriori算法的高校学生综合测评数据挖掘[J]. 现代计算机(专业版) 2017(01)
    • [17].基于Apriori关联规则的电能表检定质量影响因素分析[J]. 电测与仪表 2017(13)
    • [18].基于优化Apriori算法的中风病证治规律研究[J]. 医学信息学杂志 2017(07)
    • [19].数据挖掘中改进的Apriori算法的应用[J]. 信息记录材料 2017(01)
    • [20].基于Apriori的序列模式挖掘算法的研究[J]. 软件 2014(09)
    • [21].Apriori算法在学生信息管理系统中应用研究[J]. 电子制作 2014(24)
    • [22].网络审计系统中Apriori算法的应用与研究[J]. 科技视界 2015(29)
    • [23].基于Apriori改进算法的中药处方分析技术[J]. 西部中医药 2014(05)
    • [24].Apriori算法在杉木伴生树种选择中的应用[J]. 福建农林大学学报(自然科学版) 2008(01)
    • [25].基于Apriori关联规则临床癌性疲乏处方组方及用药规律分析[J]. 亚太传统医药 2016(21)
    • [26].Apriori算法在词性标注规则获取中的应用[J]. 计算机时代 2016(10)
    • [27].基于Apriori关联规则的城市快速路拥堵关联分析[J]. 黑龙江科技信息 2014(33)
    • [28].基于Apriori算法挖掘经验方的“前N组”法[J]. 光明中医 2015(06)
    • [29].基于十字链表的Apriori算法的实现[J]. 赤峰学院学报(自然科学版) 2012(18)
    • [30].基于Apriori算法的网上超市产品组合研究[J]. 福建电脑 2008(01)

    标签:;  ;  ;  ;  

    基于决策树分类算法和Apriori算法的数据挖掘在电信行业的应用研究
    下载Doc文档

    猜你喜欢