Web使用记录挖掘在数字图书馆个性化服务中的应用研究

论文摘要

数字图书馆使用数字技术进行信息资源的组织和管理,能够存储海量信息。随着网络上数字图书馆越来越多,数字图书馆的数据挖掘和知识发现研究具有较大的应用价值。Web使用记录挖掘是Web数据挖掘的三个研究领域中非常重要的一个研究方向,通过分析和探究Web日志记录中的规律,可以识别潜在客户,将数据挖掘技术运用到数字图书馆中,可以增强对用户的服务质量。本文从整体介绍什么是数据仓库、数据挖掘开始,由粗而细逐一介绍了Web数据挖掘、Web使用记录挖掘以及数字图书馆个性化服务系统的相关概念和知识,尤其对Web使用记录挖掘的相关理论做了重点介绍,为后续内容奠定了理论基础。第三章对数字图书馆个性化服务中数据仓库的搭建及使用记录挖掘过程作了详细介绍,利用数据挖掘软件clementine以及sqlserver2005,oracle数据库,对使用记录进行挖掘:从挖掘工具与数据库的选择,到数据仓库的搭建以及使用记录挖掘过程。根据CRISP-DM标准挖掘流程图提出了一套适合使用记录挖掘的流程图,并根据这个流程图,进行数据收集、数据理解、数据准备、模式挖掘、模式分析等操作。在数据准备阶段又依次划分为数据清理、用户识别、会话识别、路径完整4个阶段,在每个阶段中都提出了各自的算法及用clementine具体挖掘过程。用户识别阶段,提出了一个基于用户IP、登陆时间、网站的拓扑图、引用网页和Agent来识别出单个用户的新的算法。第四章主要是对第三章的挖掘过程进行实验,以黑龙江大学图书馆网站为例,挖掘用户使用模式,分析及评价所挖掘出来的模型。并对用户识别阶段提出的算法进行测试与比较。第五章为论文的结束部分,对论文进行了总结,指出了本文的创新点及不足以及进一步研究的几点设想。

论文目录

中文摘要

Abstract

绪论

第一节课题研究背景

第二节课题研究意义

一、优化站点结构

二、获取和分析读者需求信息

三、为读者提供个性化服务

四、为图书馆管理层提供决策支持

第三节国内外研究现状

一、国外同类课题研究现状

二、国内同类课题研究现状

第四节论文研究内容及结构安排

第一章相关理论背景

第一节数据仓库

一、数据仓库的概念

二、数据仓库的架构方式

（一）星形架构

（二）雪花形架构

（三）星座模式

第二节数据挖掘

一、数据挖掘技术简介

二、web 数据挖掘

（一） web 数据挖掘简介

（二） web 数据挖掘分类

三、web 使用记录挖掘相关理论

（一）统计分析

（二）关联规则

（三）序列模式

（四）聚类分析

（五）分类规则

第三节数字图书馆个性化服务系统简介

一、数字图书馆个性化服务概述

二、数字图书馆个性化服务系统创建及其功能分析

（一）个性化服务系统创建

（二）个性化服务系统功能分析

第二章数字图书馆个性化服务系统中数据仓库搭建及使用记录挖掘过程

第一节数据仓库搭建

一、数据仓库设计

（一）宏观上的数据仓库设计

（二）微观上的数据仓库设计

二、数据仓库模型搭建

第二节使用记录挖掘过程

一、挖掘工具与数据库的选择

（一）挖掘工具的选择

（二）数据库的选择

二、数据收集

三、数据理解

四、数据准备

（一）数据清理（Data Cleaning）

（二）用户识别（Users Identification）

（三）会话识别（Session Identification）

（四）路径完整（Path Completion）

五、模式挖掘

（一）路径分析

（二）关联规则

（三）聚类和分类

六、模式分析

第三章 WEB 使用记录挖掘在黑龙江大学图书馆网站日志数据中的应用

第一节黑龙江大学图书馆网站简介

第二节数据源

一、网站拓扑结构数据

二、日志数据

三、网站资源文件

第三节日志预处理

一、数据清理

二、事务识别

三、数据转换

第四节模式发现

第五节模式评价

结束语

第一节本文的创新点

第二节本文的不足及进一步研究的几点设想

参考文献

致谢

Web使用记录挖掘在数字图书馆个性化服务中的应用研究

论文摘要

论文目录

相关论文文献

猜你喜欢