铁路客票数据挖掘研究

铁路客票数据挖掘研究

论文摘要

随着计算机科学的不断发展,大量的原始数据被不断收集并存储到计算机中,而数据处理能力的低下,造成了目前信息丰富,知识贫乏的现状。数据挖掘——用非平凡的方法从大量数据中发现有用的知识,正是应此要求而迅速发展起来的一门科学。铁路中的客票系统蕴含了丰富的数据信息,如何从这海量的信息中挖掘出有用的知识,是一个有待研究解决的问题。本文将数据挖掘技术用于铁路客运营销分析中的巨量客票分析,针对铁路客票的实际特点,对客票数据进行分析,提取客流信息以及客票数据的各个属性对旅客购票行为的影响规则,用于指导铁路旅客运输组织,服务客运营销决策。本文选用SQL Server 2000作为数据仓库和数据挖掘的开发工具。分析了数据挖掘技术、可视化数据挖掘技术、OLAP以及数据仓库的基本原理,并对SQL Server 2000中决策树、聚类分析的数据挖掘算法作了重点分析。在对铁路客票系统中的数据进行了初步分析基础上,对涉及的多种数据进行了集成与转换,给出了数据仓库的详细设计过程和步骤。以京九线南昌局段下行方向08年4月份的客票数据为样本,建立了星型构架的多维数据集,分析了样本数据的客流特征,并且利用决策树和聚集技术对样本数据的席位、发车时间、列车种类字段其进行了的数据挖掘和结果分析。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 选题背景及意义
  • 1.2 国内外研究现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.3 论文的整体结构
  • 第二章 铁路客运营销与客运量预测分析
  • 2.1 铁路客运营销分析及其辅助决策支持系统
  • 2.1.1 铁路客运营销分析及其辅助决策支持系统目标
  • 2.1.2 铁路客运营销分析及其辅助决策支持系统的组成
  • 2.2 铁路客运量预测
  • 2.2.1 客运量预测的概念
  • 2.2.2 客运量预测的特点
  • 2.2.3 影响客运量的因素
  • 2.3 客运量预测方法
  • 2.3.1 回归分析方法
  • 2.3.2 灰色模型的预测方法
  • 2.4 小结
  • 第三章 数据挖掘概述
  • 3.1 数据挖掘的概念
  • 3.1.1 数据挖掘的产生
  • 3.1.2 数据挖掘的概念
  • 3.1.3 数据挖掘的理论基础
  • 3.2 数据挖掘系统的组成与分类
  • 3.2.1 数据挖掘系统的组成
  • 3.2.2 数据挖掘系统的分类
  • 3.3 数据挖掘技术
  • 3.3.1 联机分析处理
  • 3.3.2 关联规则挖掘技术
  • 3.3.3 分类和预测技术
  • 3.4 小结
  • 第四章 铁路客票数据挖掘关键技术分析与设计
  • 4.1 基于SQL Server 2000的数据挖掘技术
  • 4.1.1 数据挖掘工具选择
  • 4.1.2 SQL Server 2000中决策树和聚类分析算法原理
  • 4.2 铁路客票数据
  • 4.2.1 客票数据的预处理方法
  • 4.2.2 客票数据预处理分析
  • 4.3 铁路客票数据仓库设计
  • 4.3.1 事实表设计
  • 4.3.2 维度表设计
  • 4.3.3 数据仓库架构设计
  • 4.3.4 事实表与维度表的数据转换
  • 4.4 铁路客票数据挖掘设计
  • 4.4.1 基于Analysis Service的铁路客票数据挖掘方案
  • 4.4.2 Analysis Services中多维数据集设计
  • 4.5 小结
  • 第五章 铁路客票数据挖掘实证研究
  • 5.1 数据挖掘实现
  • 5.1.1 席位数据挖掘
  • 5.1.2 发车时间数据挖掘
  • 5.1.3 列车种类数据挖掘
  • 5.2 数据挖掘结果及分析
  • 5.2.1 规则知识的提取
  • 5.2.2 车站票额资源利用情况分析
  • 5.2.3 列车运能资源利用情况分析
  • 5.3 小结
  • 第六章 总结与展望
  • 6.1 主要研究工作总结
  • 6.2 需要进一步研究的问题
  • 参考文献
  • 致谢
  • 攻读学位期间主要的研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  

    铁路客票数据挖掘研究
    下载Doc文档

    猜你喜欢