论文题目: 个性化需求的描述、获取与推断—案例研究
论文类型: 博士论文
论文专业: 计算机软件与理论
作者: 张丙奇
导师: 白硕
关键词: 个性化服务系统,用户模型,本体,约简,分类,协同过滤
文献来源: 中国科学院研究生院(计算技术研究所)
发表年度: 2005
论文摘要: 个性化服务是一个自动获取用户对信息资源或借助信息形态表征的实物资源的使用信息,分析这些信息得到用户的特定兴趣和需求,然后根据分析结果在合适的时间向每一位访问者发送正确信息的过程,具有针对性、自动性特点。本文就个性化服务中的关键技术,用户与资源的描述、用户兴趣的获取与学习、推荐算法进行了研究。在研究中,针对传统个性化技术中资源、用户描述能力的不足,本文引进了领域本体模型和XML来描述资源深层的语义关系,并利用半结构化数据学习和挖掘算法从用户使用数据获取用户的模型来进行资源的推荐。具体的内容如下:(1)基于本体和XML的个性化服务系统模型传统个性化服务系统中,资源一般采用关键词向量表示,这种表示方式只考虑了资源内容,无法区分资源在层次化结构中体现出来的特征差异,在个性化推荐中无法根据资源的深层属性和特征进行推荐。本文中,我们提出了基于本体-XML的个性化服务系统模型,主要思想是利用本体对领域进行建模,描述资源的深层属性及属性间的相互关系。针对个性化服务系统中资源描述的特定需求,给出了资源描述的基本框架和该框架下利用XML对资源进行描述的方法。(2)基于本体的用户需求的描述、获取与推荐提出了基于本体的用户兴趣模型,把用户兴趣定义为领域本体中资源类的虚拟实例,描述用户结构化的兴趣特征和特征之间的相互关系;我们把用户对资源的兴趣的计算框架表示为对资源属性兴趣的加权和。借鉴前馈神经网络,通过定义泛化的delta函数,给出了用户模型的学习方法。本模型表示方法与基于关键词的表示方法相比,更易被用户理解,在表示能力和推荐精确度上有明显的提高。(3)基于半结构化规则的用户兴趣表示与推荐XML数据与表格数据不同在于XML数据具有路径并且路径之间存在结构。XML数据的约简不仅是属性的约简,而且包括路径之间关系的约简。我们定义XML数据的约简包括路径的剪枝和路径的泛化,并定义了约简结果表示。利用XML数据约简的思想,给出了半结构规则的定义。然后利用无序树范式的性质,给出一种半结构规则挖掘的算法。基于半结构化规则的用户兴趣表示反映了资源的属性及属性之间的泛化关系,表示直观,易于理解,同时具有较高的推荐精度。(4)基于语义相似度计算改进的协同过滤。协同过滤是个性化推荐系统中经常用到的方法,但是协同过滤一般存在新用户、新项目和用户评分矩阵的稀疏问题。本文在对各个问题产生的原因进行分析的基础上,提出了三个改进算法:利用语义知识、XML数据的相似度计算和用户模型的相似度计算改进传统的协同过滤算法。实验证明,这三个算法都取得了较好的效果。
论文目录:
摘要
英文摘要
第1章 绪论
1.1 研究背景
1.2 个性化、个人化与自适应超媒体
1.3 个性化服务系统研究现状
1.3.1 基于规则的个性化服务系统
1.3.2 基于内容推荐的个性化服务系统
1.3.3 基于协同推荐的个性化服务系统
1.3.4 混合推荐
1.4 典型个性化服务系统介绍
1.4.1 基于内容的推荐系统-WebMate
1.4.2 基于协同的推荐系统-Ringo[Shardanand 1995]
1.4.3 混合推荐系统-Fab
1.5 个性化研究的意义
1.5.1 个性化推荐
1.5.2 个性化信息检索
1.5.3 个性化数字图书馆
1.5.4 E-learning
1.5.5 电子商务与客户关系管理
1.6 本文研究的目标和内容
1.7 本文组织结构
第2章 个性化服务中用户建模相关研究
2.1 个性化服务系统中资源描述
2.1.1 基于内容的方法
2.1.2 基于分类的方法
2.1.3 基于概念分类体系的表示
2.2 用户兴趣描述方式
2.2.1 基于评分的表示(Rating based)
2.2.2 基于内容的表示
2.2.3 基于知识的用户profile表示
2.3 用户信息及其收集方式
2.3.1 用户信息类型
2.3.2 用户信息收集方式
2.3.3 信息搜集的位置
2.4 用户模型学习与资源推荐技术
2.4.1 访问时间和频度
2.4.2 时间衰减函数
2.4.3 基于内容的过滤
2.4.4 关联规则挖掘
2.4.5 聚类技术
2.4.6 KNN(K最近邻居)算法
2.4.7 朴素贝叶斯算法
2.4.8 神经网络
2.4.9 其它机器学习方法
2.5 协同过滤算法
2.5.1 评分矩阵及其获取
2.5.2 协同过滤算法
2.6 相关文献中原型系统的技术实现
2.7 个性化效果的测试与评价
2.7.1 评测标准
2.7.2 评测数据
第3章 基于本体-XML的个性化服务系统模型
3.1 引言
3.1.1 XML简介
3.1.2 本体
3.1.3 语义网
3.1.4 XML、本体在个性化服务系统中的应用
3.2 基于ONTOLOGY和XML的个性化服务模型
3.3 领域知识描述框架
3.3.1 类
3.3.2 属性
3.3.3 关系
3.3.4 个体
3.4 领域知识的XML表示
3.5 资源库的建立
3.6 例子-电影领域本体
3.7 用户模型
3.8 系统的功能模块
3.9 总结与讨论
3.9.1 本体和资源库的建立方式
3.9.2 基于本体信息导引查询生成
3.9.3 本体引导的用户模型生成
第4章 基于本体-XML的用户兴趣描述及资源推荐技术
4.1 引言
4.2 用户兴趣定义与描述
4.3 XML资源的数据表示
4.4 用户对资源的兴趣度计算
4.5 用户兴趣模型获取
4.5.1 反馈机制
4.5.2 学习机制
4.6 资源推荐
4.7 学习举例
4.8 实验分析
4.8.1 实验数据说明
4.8.2 实验方法
4.8.3 实验结果与分析
4.9 总结
第5章 基于半结构化规则的用户兴趣描述与推荐技术
5.1 引言
5.2 问题描述
5.2.1 个性化与分类
5.2.2 知识约简与粗集(Rough Sets)理论[史忠植2002]
5.2.3 XML约简思想
5.3 XML约简问题的形式化定义
5.3.1 树及其相关概念
5.3.2 XML数据模型
5.3.3 XML约简操作与结果表示
5.3.4 半结构化分类规则
5.4 半结构规则挖掘算法
5.4.1 无序树及其范式
5.4.2 无序树范式性质
5.4.3 无序树扩展
5.4.4 树映射和匹配计数
5.4.5 规则挖掘算法实现
5.5 利用规则进行分类
5.5.1 规则与样本的匹配
5.5.2 类别预测
5.6 数据实验
5.6.1 数据说明
5.6.2 实验结果
5.7 讨论与问题展望
第6章 基于语义计算改进的协同推荐技术
6.1 引言
6.2 协同过滤算法问题分析
6.3 基于领域分类知识的协同过滤算法
6.3.1 背景介绍
6.3.2 算法流程
6.3.3 实验分析
6.4 基于项语义计算改进的协同过滤算法
6.4.1 背景介绍
6.4.2 XML数据相似性计算
6.4.3 基于项语义计算改进的协同过滤算法
6.4.4 实验分析
6.5 基于用户兴趣模型的协同推荐算法
6.5.1 背景介绍
6.5.2 算法流程
6.5.3 实验分析
6.6 总结
第7章 个性化服务系统FINDPAPER的实现
7.1 简介
7.2 体系结构
7.3 领域模型与资源描述
7.4 用户信息搜集
7.4.1 用户背景信息收集
7.4.2 用户访问行为
7.5 用户模型
7.6 个性化推荐
7.6.1 基于用户兴趣模型的推荐
7.6.2 根据规则的推荐
7.6.3 协同推荐
7.6.4 多种推荐结果的融合
7.7 小结
第8章 总结与展望
8.1 本文的贡献
8.1.1 基于本体-XML的个性化服务系统模型
8.1.2 基于本体-XML的用户兴趣模型
8.1.3 基于半结构化规则的用户需求描述
8.1.4 基于项目和用户兴趣模型语义计算改近的协同过滤算法
8.2 进一步的研究方向
8.2.1 用户兴趣的漂移问题
8.2.2 本体的自动学习与资源标注
8.2.3 基于语义Web的个性化技术研究
8.2.4 半结构化数据的分类、聚类问题
附录
参考文献
致谢
作者简介
发布时间: 2006-12-27
参考文献
- [1].基于信息流的个性化服务研究[D]. 丁连红.中国科学院研究生院(计算技术研究所)2006
- [2].社会化用户模型研究及其在推荐系统中的应用[D]. 郑建兴.上海大学2015
- [3].基于语义的用户建模技术与应用研究[D]. 潘建国.上海大学2009
- [4].农业垂直搜索引擎语义化若干问题的研究与实现[D]. 胡宜敏.中国科学技术大学2012
- [5].基于CBR的协同Web搜索研究[D]. 孙静宇.太原理工大学2010