论文摘要
数据仓库和数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是决策支持系统的关键因素,数据仓库是一个支持管理决策过程的、面向主题的、随时间而变的数据集合,它是集成的,也是稳定的。数据挖掘是采用人工智能的方法对数据库和数据仓库中的数据进行分析、获取知识的过程。它们的结合能更好地为企业或有关部门不同范围的决策分析提供有力的依据。在网络应用环境和趋势发生变化的今天,“中国的校园网建设正在从‘万兆校园网’向‘数字化校园网’过渡”,在这一过渡期中,现阶段的建设主题正由带宽、链路等“硬主题”向数据集中、数据整合、应用与管理智能等“软主题”迁移,一个新的教育信息化建设时代正在来临,将从过去的“基础网络核心时代”逐渐跨入到“数据核心时代”。如何在大量数据中发现所隐含的规律,从而应用这些规律去指导学校的工作,数据挖掘技术无疑将在这当中起着越来重要的作用。本文主要探讨了基于数据仓库的数据挖掘技术的基本理论和实施方法,探索了数据挖掘分类方法和聚类方法。结合学生信息管理系统,改进分类方法中的决策树算法并应用于英语四级成绩分析,实现聚类方法中的k-平均算法和k-中心点算法并应用于学生毕业情况分析,从而挖掘出潜在的学生发展相关规律,为大学学生信息管理、决策提供科学依据。以往的学生信息管理系统,多半是OLTP系统,缺乏综合分析、辅助决策的能力,并且对其历史积累的海量信息中隐含知识的利用无能为力。通过在学生信息管理系统中的具体挖掘实践,得到了许多有价值的信息,这些知识在帮助学校更好地进行学生的培养,对学生表现情况的掌握以及课程的安排等方面无疑具有重要的指导意义。
论文目录
摘要ABSTRACT1 绪论1.1 研究背景及意义1.2 国内外现状1.3 研究内容及方法2 数据仓库及数据挖掘理论2.1 数据仓库概述2.1.1 为什么需要数据仓库2.1.2 数据仓库的特点2.1.3 数据仓库的体系结构2.1.4 数据仓库系统的设计2.2 数据挖掘概述2.2.1 数据挖掘的演变过程及定义2.2.2 数据挖掘流程和分类2.2.3 数据挖掘的功能2.2.4 数据挖掘工具3 构建学生信息管理系统数据仓库3.1 学生信息管理系统数据仓库构建策略3.2 学生信息管理数据仓库体系结构3.2.1 学生信息管理系统数据仓库体系结构3.2.2 学生信息管理数据仓库主题分析3.3 学生信息管理数据仓库的设计与实现3.3.1 ETL 的设计3.3.2 元数据的设计4 学生信息管理数据挖掘系统设计及核心技术4.1 系统运行环境4.2 学生信息管理数据挖掘系统总体设计4.3 学生信息管理数据挖掘系统流程图4.4 核心技术4.4.1 系统开发环境4.4.2 数据预处理4.4.3 英语四级成绩的数据整理5 数据挖掘算法研究及其改进5.1 决策树算法5.1.1 分类算法概述5.1.2 决策树描述5.1.3 决策树生成过程5.1.4 决策树构造算法描述及评价5.1.5 决策树的修剪5.1.6 决策树算法改进5.1.7 由决策树提取分类规则5.2 聚类分析5.2.1 聚类分析概述5.2.2 聚类分析中的数据类型和距离的度量5.2.3 聚类方法的分类5.2.4 聚类的过程5.2.5 基于质心的划分算法:K-平均算法5.2.6 基于有代表性对象的划分算法:k-中心点算法6 学生信息管理系统数据挖掘系统的实现及结果分析6.1 学生信息管理系统数据挖掘系统数据结构6.2 系统功能6.3 数据仓库模块6.3.1 数据导为导出向导的实现6.3.2 生成各专业核心课6.3.3 维表的创建与填充6.4 项目存储模块6.5 数据预处理模块6.5.1 数据预处理流程6.5.2 数据预处理的实现6.6 数据分析模块6.7 数学建模与结果分析模块6.7.1 决策树建模6.7.2 聚类分析建模7 结论致谢参考文献
相关论文文献
标签:数据挖掘论文; 数据仓库论文; 决策树论文; 聚类分析论文; 学生信息管理系统论文;