基于MDA的数据分析过程研究

基于MDA的数据分析过程研究

论文摘要

当今时代随着计算机技术的高速发展,管理信息系统开始普及,各行各业都逐渐建立起自己的管理信息系统。这些系统运行一段时间之后,会形成大量的历史数据,但是这些系统不具备对数据进行分析的能力,海量数据就不会被充分利用,数据中隐含的大量信息也不能被挖掘出来,没法对人们提供决策支持的功能。因此人们开始想办法挖掘隐含在这些数据背后的有用信息。在这种情况下,数据分析技术应运而生目前对数据分析的研究已经有很多,但是研究的目标主要集中在商业领域,且数据分析的落脚点是财务数据。对于教育行业这样一个非盈利性行业,面临经费不足、技术人员匮乏的困难,再加上与商业领域之间的行业差异,目前的数据分析工具或方法以及数据分析过程中的细节显然不能完全适用于教育行业,必须要根据这个行业本身的特点摸索新的数据分析过程。高成本、太复杂的方式显然不适合教育行业,要满足它特有的需求,就需要挖掘新的方法,因此数据分析技术面临新的问题和挑战。本文的主要研究内容和工作主要有以下几个方面:首先建立数据模型,将从各个数据源得到的原始数据抽取出来,通过分析设计针对它们的数据结构、数据操作和数据之间的约束,形成中间库数据的数据模型;确定分析主题和分析角度之后,将它们之间的逻辑关系抽象出来,形成目标数据端的数据模型。其次建立了结构化数据的采集模型,将数据抽取-数据转化-数据加载的流程抽取为平台无关模型,其中的具体内容和细节通过XML配置,克服了硬编码的局限性,增强了数据采集的灵活性、可扩展性和可移植性。再次采用了中间库与文件相结合的方式对数据进行抽取,解决了异构数据源的数据获取问题;针对不同的情况定义不同的规则,采用规则引擎处理不同的空值情况;采用基于分组的相似重复记录检测方法,对不同的关键字定义不同的等级,根据等级高低反复检测来解决重复记录检测不准确的问题。最后针对非结构化数据中的主观数据采集,提出了自动调查问卷的设计方式,通过自动生成调查问卷,在网上实时获得调查结果,形成了主观数据的采集模型,提高了数据分析的全面性和准确性。本文针对教育行业的特点,将模型驱动架构与数据分析结合起来,并进行了探索性的研究,希望为教育行业的数据分析提供一种有效、通用的思路和方法。本文的课题基础也是目前数据分析领域应用比较广泛的技术,不但为增强数据分析的通用性提供了思路和方法,同时也为拓展模型驱动架构的应用领域提供了一定的帮助。这使本文课题研究既具有探索性的理论研究价值,也具有较大的应用价值和现实意义。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 主要研究内容
  • 1.4 本文结构
  • 第2章 模型的建立与描述
  • 2.1 数据模型
  • 2.1.1 多维数据模型的建立
  • 2.1.2 多维数据模型的描述
  • 2.1.3 维度结构分类
  • 2.2 过程模型
  • 2.3 模型描述语言
  • 2.4 模型管理
  • 2.5 小结
  • 第3章 数据采集过程
  • 3.1 结构化数据的采集
  • 3.1.1 异构数据源的数据获取
  • 3.1.2 数据清洗
  • 3.1.2.1 编码统一
  • 3.1.2.2 空值处理
  • 3.1.2.3 重复记录处理
  • 3.1.3 数据质量
  • 3.2 非结构化数据的采集
  • 3.2.1 非结构化客观数据采集
  • 3.2.2 非结构化主观数据采集
  • 3.3 小结
  • 第4章 数据统计分析与展现
  • 4.1 统计分析
  • 4.2 结果展现
  • 4.2.1 报表输出
  • 4.2.2 OLAP展现
  • 4.2.3 数据挖掘
  • 4.3 小结
  • 第5章 总结和展望
  • 参考文献
  • 致谢
  • 攻读硕士学位期间发表的学术论文
  • 攻读硕士学位期间参与科研项目情况
  • 学位论文评阅及答辩情况表
  • 相关论文文献

    • [1].大数据背景下在线学习数据分析方案设计[J]. 软件工程 2020(01)
    • [2].教育数据分析的层次性及其使用[J]. 教育导刊 2020(01)
    • [3].改进大数据分析应对网络安全挑战[J]. 计算机与网络 2019(23)
    • [4].《2019年双11洞察数据分析报告》发布[J]. 计算机与网络 2019(23)
    • [5].商业银行零售业务中大数据分析的应用[J]. 现代营销(下旬刊) 2019(12)
    • [6].市场营销中大数据分析的应用[J]. 区域治理 2019(40)
    • [7].大数据分析在兴丰填埋场除臭设备运行研究[J]. 能源与环境 2020(01)
    • [8].应用医疗大数据分析提升临床研究可行性及效力[J]. 医学信息学杂志 2019(12)
    • [9].当前大数据分析与云计算网络技术剖析[J]. 网络安全技术与应用 2020(03)
    • [10].大数据分析时代对市场营销的影响[J]. 现代营销(下旬刊) 2020(02)
    • [11].大数据分析对工程造价精确性的影响探析[J]. 时代金融 2020(08)
    • [12].大数据分析的困境及语境论视域下的解决思路[J]. 学理论 2020(03)
    • [13].试析高中生数据分析素养的培养策略[J]. 计算机产品与流通 2020(03)
    • [14].基于“过程→生成”教学理念的中小学生数据分析观念培养研究[J]. 韩山师范学院学报 2019(06)
    • [15].大数据分析对电商营销的促进作用及其优化[J]. 农村经济与科技 2020(04)
    • [16].我国设计教育现状及对策——基于数据分析的方法[J]. 教育教学论坛 2020(17)
    • [17].网络图数学公式在大数据分析中的应用[J]. 玉林师范学院学报 2019(05)
    • [18].人力数据分析精要[J]. 经理人 2020(05)
    • [19].我国科技馆类型、规模、效益之数据分析[J]. 科学教育与博物馆 2017(02)
    • [20].大数据分析在教学评价体系中的建议与实践[J]. 汉江师范学院学报 2020(03)
    • [21].基于大数据分析的在线学习算法理论探究[J]. 科学咨询(科技·管理) 2020(08)
    • [22].小学生数据分析观念认知发展研究[J]. 教育导刊 2020(08)
    • [23].云计算技术在计算机大数据分析中的运用对策[J]. 信息与电脑(理论版) 2020(16)
    • [24].大数据分析与应用问题研究[J]. 计算机产品与流通 2020(11)
    • [25].大数据分析与实践研究[J]. 电脑编程技巧与维护 2020(09)
    • [26].大数据分析时代对市场营销的影响研究[J]. 中国管理信息化 2020(17)
    • [27].大数据分析及处理综述[J]. 太原科技大学学报 2020(06)
    • [28].新课程理念下培养学生数据分析观念的研究[J]. 韶关学院学报 2020(09)
    • [29].基于大数据分析的体育运动员训练进度智能化模型设计[J]. 自动化技术与应用 2020(10)
    • [30].电子商务中的大数据分析综述[J]. 电子商务 2020(11)

    标签:;  ;  ;  ;  

    基于MDA的数据分析过程研究
    下载Doc文档

    猜你喜欢