大型电子商务网站的数据挖掘

大型电子商务网站的数据挖掘

论文摘要

数据挖掘是近年来比较热门的技术,在各种行业中均得到了很大的发展,但是在电子商务的应用过程中,还没有得到长足的应用,本文根据一个虚构的电子商务网站进行了某些功能的数据挖掘,取得了一定的进展。数据仓库和数据挖掘是两项不同的技术。数据仓库是区别于数据库的一种新的数据存储形式,它将数据库中的数据按决策需求进行重新组织,以多维空间结构形式存储数据。数据挖掘是从数据库中发现知识的核心技术,它是从人工智能的机器学习中发展起来的。虽然数据仓库和数据挖掘是两项不同的技术,但是它们又有共同之处,两者都是在数据库的基础上发展起来的,它们都是决策支持新技术。数据仓库利用综合数据得到宏观信息,利用历史数据进行预测;而数据挖掘是从数据库中挖掘知识,也用于决策分析。虽然数据仓库和数据挖掘支持决策分析的方式不同,但是它们完全可以结合起来,提高决策分析的能力。大量的数据仓库已经把数据挖掘技术作为它的前端分析工具,以提高数据仓库的决策分析能力。面对激烈的竞争,目前流通企业为了保持持续实现盈利,迫切需要一个功能强大的信息化管理系统为其提供全面、及时、准备的分析数据,使管理层在最短时间内全面了解企业的运营情况,及时做出决策。通过数据挖掘模型,管理层能够及时对客户信息进行了解和分析,并及时做出决策,从而增加企业对客户的保持能力和获取能力。大型电子商务网站每天的交易信息是海量的,如何从交易信息中,将各种商品的信息有效的联系起来是非常重要的。同时,如何让很多潜在客户在浏览网页的过程中,成为注册用户,并且购买商品,也是非常重要的过程。以前使用的传统报表系统列出的往往是表面上的数据信息,但是海量数据深处潜在含有哪些规则呢?什么客户对我们价值最大,产品之间相互关联的程度如何?越是深层的规则,对于决策支持的价值越大,但是,也越难挖掘出来。因此,随着时代的发展,传统报表系统已经不能满足日益增长的业务需求了,企业期待着新的技术。数据分析和数据挖掘的时代正在来临。实践证明,对一个大型电子商务网站来说,除了目前建立的数据仓库以外,更应实现统一、规范、海量数据信息的查询决策分析,这就可以利用基于决策树构建大型电子商务网站的数据挖掘模型来解决这难题,避免管理层在经营管理的决策中盲目判断,从而积极地面对和有效地解决这些问题。通过现代企业管理观念,通过对市场、客户关系的管理以及对知识的挖掘,促进企业的销售水平和服务质量,增加企业的收入,同时提高客户的满意度。本文建立了一个虚构的电子商务网站www.e-commerce.com,建立了此网站的数据库系统,。使用Microsoft决策树创建OLAP数据挖掘模型,并根据挖掘的结果实现部分功能。整个数据仓库的模型分为以下几个部分:数据获取:主要用于从源数据库中获取销售数据、客户数据、产品数据和时常数据等,并进行清洁、传输,将它加到数据仓库数据库中。数据管理与多维建模:建立以客户、产品和销售为主题的多维数据模型,及时地刷新数据仓库以反映数据源的变化,并将数据仓库中的数据作转储。在每个更新周期内,重建或全面刷新集成后的数据仓库是不现实的,必须进行渐增的更新,即在增加新的数据到数据仓库中时,必须保护已有的数据。分析处理:进行指标分析、多维数据分析和数据挖掘。重要内容有客户分析、销售分析等。信息服务:主要包括经营建议、个性化服务和信息咨询等功能。在实施数据挖掘的过程中,几乎都需要用户参与,要完全实现挖掘过程的自动化,到目前来说还是不现实的。比如在数据获取这个部分,需要用户选择数据库、选择数据表、选择用于挖掘的属性、如何对属性值进行处理等。随着挖掘建模过程的进行,数据从数据源(一般数据库、表或者普通文件)流向结果模式,并且数据流总是在朝简单、有用的方向发生变化。整个数据挖掘的过程实现了以下功能(1).通过客户的信息,重新对对客户的忠诚度进行了定义,并推出了新的折扣方案,使得客户的满意度和忠诚度提高。(2)通过客户信息,分析了客户整体的购买意向与购买兴趣,使得广告和商品推荐更加有效率。(3)通过已经分析出来的客户属性,对整体的客户应经分析和预测。通过对网站的数据挖掘,我们可以得出以下结论(1)数据挖掘可以迅速的识别顾客行为,从而制定网站决策。(2)数据挖掘可以体现广告的效果,及时调整广告策略。(3)数据挖掘可以改进网站的整体的设计。

论文目录

  • 第一章 绪论
  • 1.1 课题背景
  • 1.2 大型电子商务网站的数据挖掘模型
  • 1.3 课题重点
  • 第二章 相关技术介绍
  • 2.1 数据挖掘
  • 2.2 数据仓库
  • 2.3 决策树
  • 2.4 Analysis Services
  • 第三章 E-Commerce 数据库系统
  • 3.1 需求分析
  • 3.2 概要设计
  • 3.3 逻辑结构设计
  • 3.4 物理结构设计
  • 第四章 数据仓库概念模型设计
  • 4.1 任务概述
  • 4.2 开发方式
  • 4.3 设计方法
  • 4.4 系统结构
  • 4.5 星型模型设计
  • 4.6 雪花模型设计
  • 4.7 数据挖掘与OLAP 设计
  • 4.8 安全维护设计
  • 第五章 基于决策树的大型电子商务网站的数据挖掘模型
  • 5.1 使用 Microsoft 决策树创建 OLAP 数据挖掘模型
  • 5.2 浏览OLAP 数据挖掘维度和虚拟多维数据集
  • 5.3 使用 Microsoft 聚集创建 OLAP 数据挖掘模型
  • 5.4 使用 Microsoft 决策树创建关系数据挖掘模型
  • 5.5 浏览相关性网络
  • 第六章 总结
  • 参考文献
  • 摘要
  • Abstract
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    大型电子商务网站的数据挖掘
    下载Doc文档

    猜你喜欢