论文摘要
数字图书馆使用数字技术进行信息资源的组织和管理,能够存储海量信息。随着网络上数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的应用价值。Web使用记录挖掘是Web数据挖掘的三个研究领域中非常重要的一个研究方向,通过分析和探究Web日志记录中的规律,可以识别潜在客户,将数据挖掘技术运用到数字图书馆中,可以增强对用户的服务质量。本文从整体介绍什么是数据仓库、数据挖掘开始,由粗而细逐一介绍了Web数据挖掘、Web使用记录挖掘以及数字图书馆个性化服务系统的相关概念和知识,尤其对Web使用记录挖掘的相关理论做了重点介绍,为后续内容奠定了理论基础。第三章对数字图书馆个性化服务中数据仓库的搭建及使用记录挖掘过程作了详细介绍,利用数据挖掘软件clementine以及sqlserver2005,oracle数据库,对使用记录进行挖掘:从挖掘工具与数据库的选择,到数据仓库的搭建以及使用记录挖掘过程。根据CRISP-DM标准挖掘流程图提出了一套适合使用记录挖掘的流程图,并根据这个流程图,进行数据收集、数据理解、数据准备、模式挖掘、模式分析等操作。在数据准备阶段又依次划分为数据清理、用户识别、会话识别、路径完整4个阶段,在每个阶段中都提出了各自的算法及用clementine具体挖掘过程。用户识别阶段,提出了一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新的算法。第四章主要是对第三章的挖掘过程进行实验,以黑龙江大学图书馆网站为例,挖掘用户使用模式,分析及评价所挖掘出来的模型。并对用户识别阶段提出的算法进行测试与比较。第五章为论文的结束部分,对论文进行了总结,指出了本文的创新点及不足以及进一步研究的几点设想。
论文目录
中文摘要Abstract绪论第一节 课题研究背景第二节 课题研究意义一、优化站点结构二、获取和分析读者需求信息三、为读者提供个性化服务四、为图书馆管理层提供决策支持第三节 国内外研究现状一、国外同类课题研究现状二、国内同类课题研究现状第四节 论文研究内容及结构安排第一章 相关理论背景第一节 数据仓库一、数据仓库的概念二、数据仓库的架构方式(一) 星形架构(二) 雪花形架构(三) 星座模式第二节 数据挖掘一、数据挖掘技术简介二、web 数据挖掘(一) web 数据挖掘简介(二) web 数据挖掘分类三、web 使用记录挖掘相关理论(一) 统计分析(二) 关联规则(三) 序列模式(四) 聚类分析(五) 分类规则第三节 数字图书馆个性化服务系统简介一、数字图书馆个性化服务概述二、数字图书馆个性化服务系统创建及其功能分析(一) 个性化服务系统创建(二) 个性化服务系统功能分析第二章 数字图书馆个性化服务系统中数据仓库搭建及使用记录挖掘过程第一节 数据仓库搭建一、数据仓库设计(一) 宏观上的数据仓库设计(二) 微观上的数据仓库设计二、数据仓库模型搭建第二节 使用记录挖掘过程一、挖掘工具与数据库的选择(一) 挖掘工具的选择(二) 数据库的选择二、数据收集三、数据理解四、数据准备(一) 数据清理(Data Cleaning)(二) 用户识别(Users Identification)(三) 会话识别(Session Identification)(四) 路径完整(Path Completion)五、模式挖掘(一) 路径分析(二) 关联规则(三) 聚类和分类六、模式分析第三章 WEB 使用记录挖掘在黑龙江大学图书馆网站日志数据中的应用第一节 黑龙江大学图书馆网站简介第二节 数据源一、网站拓扑结构数据二、日志数据三、网站资源文件第三节 日志预处理一、数据清理二、事务识别三、数据转换第四节 模式发现第五节 模式评价结束语第一节 本文的创新点第二节 本文的不足及进一步研究的几点设想参考文献致谢
相关论文文献
标签:数字图书馆论文; 数据挖掘论文; 日志挖掘论文; 使用记录挖掘论文; 个性化服务论文;
Web使用记录挖掘在数字图书馆个性化服务中的应用研究
下载Doc文档