论文摘要
电子商务网站每天都产生大量的点击流数据。它们中包含很多对企业非常有用的信息,例如,客户的来源、客户的行为、客户的兴趣等。对这些数据进行有效的分析,不但能够对电子商务网站的建设起到指导作用,增强网站的粘着度,而且也能够反映出企业在市场、销售、服务和财务等各个方面的状况。总之,对这些数据进行深层次分析,能够使电子商务网站的拥有者改善客户关系、充分提高企业在市场销售和服务等各个方面的质量。本文是建立在购物网站系统之上的一个实验性点击流数据仓库项目。以该网站系统为例,确定分析主题并基于多维建模思想建立各种不同粒度的数据集市;在分析了各种点击流数据源后,本文完整提出一个ETL体系结构,包括ETL调度方案,数据预处理方法,传统仓库ETL工具,后置模式装载机制。最后对点击流数据进行联机分析,展示点击流的价值。该点击流数据仓库构建方案不仅能提供网站信息分析,并且支持日志数据仓库基础上的用户使用模式的深层次挖掘和销售分析。
论文目录
摘要ABSTRACT第一章 绪论1.1 点击流数据仓库的概念与特点1.2 点击流数据仓库不同之处1.3 目前研究现状1.4 研究重点1.5 组织结构第二章 日志分析技术的发展过程2.1 网站信息分析2.2 过滤技术2.3 Web 使用情况挖掘2.4 点击流数据仓库2.5 未来研究方向第三章 点击流数据仓库的需求分析3.1 购物网站介绍3.2 系统目标和分析主题设计第四章 点击流数据仓库的多维建模及体系结构设计4.1 多维建模概述4.2 点击流数据仓库总线结构设计4.3 点击流数据仓库体系结构4.4 一致性维度4.4.1 用户时间和日期维度sitegeography)'>4.4.2 站点地理维(dsitegeography)user)'>4.4.3 用户维(duser)promotion)'>4.4.4 促销维(dpromotion)geography)'>4.4.5 物理地理维(dgeography)product)'>4.4.6 产品维(dproduct)4.5 建立不同粒度的数据集市4.5.1 页面活动数据集市4.5.2 会话数据数据集市4.5.3 销售交易数据集市第五章 点击流数据仓库ETL 的设计与实现5.1 点击流ETL 组件概述5.2 点击流ETL 体系结构5.2.1 数据流程图5.2.2 调度方案5.2.3 ETL 工具简介5.3 点击流数据仓库数据源5.3.1 web 服务器日志5.3.2 cookie5.3.3 站点内容信息5.4 点击流数据预处理5.4.1 过滤记录5.4.2 分析记录5.4.3 页面标识5.4.4 用户标识5.4.5 会话识别5.5 加载维表和事实表5.5.1 用户时间和日期维度5.5.2 站点地理维5.5.3 用户维5.5.4 产品维和促销维5.5.5 物理地理维5.5.6 页面活动事实表5.5.7 会话活动事实表5.5.8 销售交易事实表第六章 基于仓库的点击流数据分析6.1 多维数据集6.1.1 概述6.1.2 设计多维数据集6.2 OLAP 多维数据分析6.2.1 OLAP 分析基本操作6.2.2 报表展示总结参考文献致谢
相关论文文献
标签:点击流论文; 数据仓库论文; 日志论文;