论文题目: DL环境下的信息资源管理及知识发现研究
论文类型: 博士论文
论文专业: 管理科学与工程
作者: 许增福
导师: 梁静国
关键词: 数字图书馆,资源管理,知识发现,数据挖掘,算法设计
文献来源: 哈尔滨工程大学
发表年度: 2005
论文摘要: 针对数字图书馆下的信息资源组织建设问题,论文从信息资源的管理方法及网络信息的数据挖掘技术两个方面进行了研究。 首先从信息资源数字化、多媒体化、网络化等方面分析了数字图书馆信息资源的特点及现行编目方法在网络信息资源描述方面的局限性,并在此基础上阐述了用于数字图书馆信息资源描述的元数据方法;阐述了元数据的定义、类型、结构、编码语言等基础理论;研究了元数据的互操作性。对典型元数据方案都柏林核心集的应用进行了分析,探索了都柏林核心集元素的格式与应用;比较了都柏林核心集与现行编目方法的异同;并对网络信息资源的整序问题进行了讨论。 在网络信息的数据挖掘技术方面,针对传统向量空间模型存在的不足,运用模糊数学相关概念构造了模糊特征向量空间模型,提出了文档模糊特征提取及模糊特征向量的构造方法;提出了基于模糊向量空间模型的三种聚类算法:K均值聚类算法、核聚类算法、基于蚁群智能的聚类算法。其中,K均值聚类算法与核聚类算法需要预先给定聚类数目,通过不断迭代修正聚类中心,使聚类趋于稳定和精确;蚁群聚类算法无需预先给定类数,而是依据文档相似度,让蚁群携带文档移动。蚁群合作可表现出高度智能性,可以较好的完成聚类任务。应用人工智能领域的模糊逻辑、神经网络、机器学习等理论,提出了三种文档信息资源的自动分类方法:基于加权模糊推理网络的文档自动分类算法;基于自组织特征映射网络的文档自动分类算法;基于级联式支持向量机的文档自动分类算法。前两种算法首先依据已知类别的若干分类样本,构造满足输入输出关系的分类网络,然后应用不同的迭代算法完成网络的训练。加权模糊推理网络采用高斯-塞德尔迭代法求解满足输入输出映射关系的一组权系数。自组织特征映射网络采用无教师和有教师相结合的方式获得网络的分类能力。支持向量机分类算法具有较高的泛化性能,但是只能处理两类模式分类问题,级联式支持向量机可处理多个模式的分类。以上每种算法均给出了详细的分类原理和实施方案,实验部分证明了算法的有效性及可行性。 最后,论文提出了加强数字图书馆管理及知识发现的一些对策。
论文目录:
第1章 绪论
1.1 论文写作的历史背景及意义
1.1.1 论文写作的历史背景
1.1.2 论文研究的目的及意义
1.2 国内外DL相关理论及技术发展综述
1.2.1 国外DL相关理论及技术发展综述
1.2.2 国内DL相关理论及技术发展综述
1.2.3 数据仓库及相关理论及技术
1.2.4 数据挖掘及相关理论
1.3 论文的总体结构与创新之处
1.3.1 论文总体结构
1.3.2 论文创新之处
第2章 数字图书馆信息资源分析
2.1 数字信息资源概述
2.2 数字图书馆的技术体系结构
2.3 数字图书馆信息资源的类型
2.4 数字图书馆信息资源的特点
2.5 数字图书馆建设面临的技术挑战
2.5 本章小结
第3章 用于DL信息资源管理的元数据方法
3.1 元数据的基础理论
3.1.1 元数据的定义
3.1.2 元数据的类型
3.1.3 元数据的结构
3.1.4 元数据的编码语言
3.2 元数据的互操作性
3.2.1 元数据之间的映射
3.2.2 定义一种标准描述方法
3.3 对元数据方法的评价
3.4 本章小结
第4章 典型元数据方案都柏林核心集的应用
4.1 都柏林核心集发展概况
4.2 DC的元素格式与应用
4.2.1 未限定的DC元素
4.2.2 DC描述网络信息资源的应用
4.3 DC与现行编目方法的比较
4.4 DC用于网络信息资源整序的问题讨论
4.5 本章小结
第5章 数字图书馆知识管理及数据挖掘
5.1 引言
5.2 数字图书馆信息资源管理策略
5.2.1 数字图书馆信息资源的保存策略
5.2.2 数字图书馆信息资源的管理策略
5.2.3 数字信息资源管理的技术策略
5.2.4 数字信息资源管理的安全策略
5.3 元数据在数字图书馆管理中的应用
5.3.1 数字图书馆中元数据的作用
5.3.2 元数据的收集
5.3.3 元数据的维护
5.3.4 元数据的利用
5.4 数据挖掘及在数字图书馆管理中的应用
5.4.1 数据挖掘与知识发现
5.4.2 数据挖掘算法
5.4.3 数据挖掘的应用领域及商业产品介绍
5.4.4 数据挖掘面临的挑战及发展趋势
5.4.5 数据挖掘在数字图书馆中的应用
5.5 本章小结
第6章 数字图书馆信息资源聚类算法
6.1 引言
6.2 文档模糊特征提取
6.2.1 确定文档模糊特征项集合
6.2.2 构造文档模糊特征向量
6.3 K均值聚类算法
6.4 基于高维特征空间的核聚类算法
6.4.1 核函数概念
6.4.2 算法原理
6.4.3 算法描述
6.4.4 实际应用分析
6.5 基于蚁群智能的文档聚类算法
6.5.1 蚁群智能及相关的聚类算法
6.5.2 基于蚁群智能的文档聚类算法
6.5.3 实际应用分析
6.6 本章小结
第7章 数字图书馆信息资源自动分类算法
7.1 引言
7.2 基于加权模糊推理网络的文档自动分类方法
7.2.1 加权模糊推理网络模型
7.2.2 加权模糊推理网络分类算法
7.2.3 实际应用
7.3 基于自组织特征影射网络的文档自动分类算法
7.3.1 自组织特征映射网络模型
7.3.2 自组织特征映射网络分类算法
7.3.3 实际应用
7.4 基于级连式支持向量机的文本自动分类算法
7.4.1 支持向量机分类原理
7.4.2 级连式支持向量机分类算法
7.4.3 实际应用
7.5 本章小结
第8章 加强数字图书馆管理的对策
8.1 引言
8.2 我国数字图书馆建设中存在的问题
8.3 加强数字图书馆信息资源管理对策
8.4 加强数字图书馆知识发现对策
8.4.1 知识发现过程和特点
8.4.2 知识发现在信息发现中的应用
8.4.3 知识发现在信息提供中的应用
8.5 本章小结
结论
参考文献
攻读博士学位期间发表的论文和取得的科研成果
致谢
发布时间: 2005-10-21
参考文献
- [1].本体的构建及其在数字图书馆中的应用研究[D]. 杜文华.武汉大学2005
- [2].基于本体的数字图书馆语义互操作[D]. 刘炜.复旦大学2006
- [3].中国农业数字图书馆信息集成服务系统研究[D]. 卓文飞.中国农业科学院2008
- [4].语义网格环境下数字图书馆知识组织策略与应用研究[D]. 韩毅.吉林大学2008
- [5].数字图书馆资源聚合与服务推荐研究[D]. 刘健.吉林大学2017
- [6].数字图书馆信息接受情境及其优化研究[D]. 晁亚男.吉林大学2015
- [7].高校数字图书馆用户接受研究[D]. 许炜.武汉大学2009
- [8].基于数据挖掘技术的复合图书馆流程优化研究[D]. 秦嘉杭.南京大学2011
- [9].数字图书馆内容管理开源软件应用与评价研究[D]. 李鹏.吉林大学2012
- [10].数字图书馆知识组织语义互联策略及其应用研究[D]. 牟冬梅.吉林大学2009
相关论文
- [1].网络商务信息资源管理的理论与实践研究[D]. 王进孝.中国科学院研究生院(文献情报中心)2002
- [2].我国建筑业信息资源管理研究[D]. 张凯.华中科技大学2004
- [3].基于领域知识的知识发现研究[D]. 杨立.中国科学院研究生院(软件研究所)2005
- [4].企业信息资源集成管理研究[D]. 黄杰.武汉理工大学2005
- [5].基于知识管理的企业学习型组织模式研究[D]. 张倩.哈尔滨工程大学2005
- [6].联合数字图书馆信息服务的关键技术研究[D]. 欧洁.中国科学院研究生院(计算技术研究所)2002
- [7].基于本体的数字图书馆语义互操作[D]. 刘炜.复旦大学2006