关于商业数据处理的几点研究

关于商业数据处理的几点研究

论文摘要

数据挖掘和文本挖掘是商业数据处理应用中比较有效的技术和方法,它们同时也是商业数据处理高端技术的代表,而数据处理结果的展示和传递则是商业数据处理的一个完整的解决方案所不可或缺的;另外这三个方面也是商业智能中应用最广泛的领域,成功实现了这三个方面的应用,也就构建和完善了商业智能应用的基本框架和商业智能应用解决方案的主体部分;而目前国内外的有关这三个方面的研究和应用仍存在较大探索空间。本文对这三个方面进行了较深入而全面的研究和实践,在消化、吸收和应用各种(新)技术的基础上论述了实现这三个方面的应用的多种方法,提出了一个完整的解决方案,并以它们为应用范例来论述如何完善这三个方面的应用。本文指出了目前数据挖掘研究和应用中的欠缺,例如应用中算法比较单一;对数据挖掘的概念和理论以及数据挖掘过程的理解仍不够深刻,甚至存在一些误解;对挖掘结果的理解、分析及应用不足。针对这些欠缺,本文择要论述了数据挖掘的理论、技术基础和相关概念以及它们之间的关系,对各种常见数据挖掘算法进行了分析和比较,论述了数据挖掘系统的选择原则,为数据挖掘应用提供了若干指导原则,并举例论述了数据挖掘与商业数据处理的其它应用的集成。本文对文本挖掘预处理的若干重要技术、文本数据的分类和聚类挖掘、自动文摘以及文本挖掘的其它领域的技术和原理进行了较系统和深入的研究和分析,论述这些技术时本文前后呼应,并将其中的一些技术结合起来论述,理清了文本挖掘的思路。本文提出了关于商业信息的展示和传递的5个重要的、亟待解决的问题。针对这些问题,本文论述了商业信息的展示和传递的多种技术、采用信息传递技术的策略,重点论述了SQL Server 2005的报表服务和通知服务的技术,这两种技术能够很好地支持商业信息的展示和传递的应用开发。在对数据挖掘、文本挖掘以及商业信息的展示和传递的相关技术的理论分析的基础上,本文详细论述了对数据挖掘结果的理解和分析以及对挖掘模型的评估技巧;详细论述了实现文本挖掘的预处理、英文文本数据的分类挖掘、中文文本文档的自动分类以及英文文本数据的聚类挖掘的应用范例。本文以SQL Server 2005为开发工具(重点应用了其报表服务),结合微软的SharePoint服务、Windows域的应用和管理以及网站开发技术,开发了展示和传递商业信息的完整可行的应用系统。此系统经过实际运行与验证,达到了预定的目标,并解决了此领域存在的若干问题;该解决方案完全可以应用于很多机构的相关项目中。本文的意义在于深化了对数据挖掘、文本挖掘以及商业信息的展示和传递的研究和应用,弥补了此前这些方面的不足,并为这些方面重新提出了研究热点。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 应用背景和问题的提出
  • 1.2 研究动机
  • 1.3 研究内容
  • 1.4 论文结构
  • 第2章 数据挖掘技术
  • 2.1 数据挖掘的理论、技术基础和相关概念
  • 2.1.1 数据挖掘的渊源
  • 2.1.2 数据挖掘的理论基础
  • 2.1.3 数据挖掘的技术基础
  • 2.1.4 数据挖掘技术的分类
  • 2.1.5 数据挖掘及其相关概念、技术和应用之间的关系
  • 2.2 关于多种数据挖掘算法的分析及比较
  • 2.2.1 SQL Server 2005 的9 个挖掘算法
  • 2.2.2 其它常用数据挖掘算法
  • 2.2.3 挖掘模型的调节和修改
  • 2.2.4 数据挖掘算法/模型的选用
  • 2.3 对数据挖掘系统的选择
  • 2.3.1 国外较有影响力的数据挖掘系统
  • 2.3.2 选择数据挖掘系统产品的原则
  • 2.3.3 微软的SQL Server 2005 数据挖掘系统
  • 2.4 关于数据挖掘应用的一些指导原则
  • 2.5 数据挖掘与其它应用的集成
  • 2.6 本章小结
  • 第3章 文本挖掘技术
  • 3.1 文本挖掘的一些预处理技术
  • 3.2 文本数据的分类和聚类挖掘
  • 3.2.1 文本数据的分类挖掘
  • 3.2.2 文本数据的聚类挖掘
  • 3.3 自动文摘
  • 3.3.1 自动文摘的一种分类
  • 3.3.2 多文档自动文摘
  • 3.4 其它文本挖掘技术
  • 3.5 本章小结
  • 第4章 商业信息的展示和传递技术
  • 4.1 商业信息的展示技术
  • 4.2 构建传递信息和知识的统一平台
  • 4.3 商业信息的传递技术
  • 4.4 SQL SERVER 2005 的报表服务
  • 4.5 SQL SERVER 2005 的通知服务
  • 4.6 本章小结
  • 第5章 商业数据处理应用
  • 5.1 数据挖掘结果的分析和应用
  • 5.1.1 对挖掘结果的分析
  • 5.1.2 对挖掘模型/结果的评估
  • 5.1.3 数据挖掘应用小结
  • 5.2 文本挖掘的应用
  • 5.2.1 模糊查找
  • 5.2.2 中文字词级别的分析
  • 5.2.3 英文文本的分类挖掘
  • 5.2.4 中文文本文档的自动分类
  • 5.2.5 英文文本的聚类挖掘
  • 5.2.6 文本挖掘应用小结
  • 5.3 商业信息的展示和传递的综合解决方案
  • 5.3.1 网页报表展示应用系统的成果及分析
  • 5.3.2 发布/传递报表的解决方案
  • 5.3.3 报表应用与SharePoint 应用的集成
  • 5.3.4 其它技术故障及其解决方法
  • 5.3.5 商业信息的展示和传递应用的小结
  • 第6章 结束语与展望
  • 6.1 本文工作回顾
  • 6.2 存在的不足和展望
  • 参考文献
  • 致谢
  • 本文作者攻读学位期间发表的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    关于商业数据处理的几点研究
    下载Doc文档

    猜你喜欢