最优搜索理论与支持向量机在信息检索中的应用研究

最优搜索理论与支持向量机在信息检索中的应用研究

论文摘要

随着网络技术的迅猛发展,网上的信息数量成指数级别增长,如何有效组织、检索、处理这些信息成为当前研究的重要课题。信息检索是指从海量文本信息中找到与给定信息需求想关的一定数量文档的过程。传统的信息检索,比较关注于检索结果的准确性等特性,对检索资源(如时间)的限制讨论的比较少。本文正是针对上述问题,提出了一种基于支持向量机的最优搜索模型,讨论了在资源受限制条件下的搜索策略。本文主要内容为:1.研究了分布式信息检索中的资源描述和资源选择方法。提出了一种新的基于支持向量机的最优搜索模型,同时考虑检索的资源限制和准确度问题。2.对文本分类的支持向量机与核函数方法进行了深入分析。以往的大多数研究,主要关注文本的向量空间模型表示法,对文本序列表示法的分类研究比较少。本文在字符串序列核函数与词序列核函数的基础上,提出了一种新的基于句子级别核函数,并给出两种可行算法,句集合核函数与旬序列核函数。3.研究了支持向量机软件包LIBSVM并加以改进。LIBSVM的CSharp2.6版,只支持基本的核函数计算:如线性核函数、多项式核函数、RBF核函数等,对于用户自定义的核函数还没有提供支持。而本文提出的核函数是基于句子级别的特定类型核函数,也会用到序列核函数的算法,所以必须要求软件包能够提供自定义核函数的功能。4.综合所有的研究成果,独立完成了一个文本分类及检索系统。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 信息检索相关技术的研究现状
  • 1.2 本文研究内容
  • 1.3 本文组织结构
  • 第二章 最优搜索理论
  • 2.1 最优搜索理论的历史回顾
  • 2.2 静止目标最优搜索模型
  • 2.2.1 Koopman的静止目标最优搜索模型
  • 2.3 算法的实现
  • 第三章 支持向量机与核函数
  • 3.1 统计学习理论与支持向量机
  • 3.1.1 支持向量机的理论基础
  • 3.1.2 结构风险最小化原则
  • 3.1.3 线性可分情形
  • 3.1.4 线性不可分情形与软间隔
  • 3.1.5 线性不可分情形与核函数
  • 3.2 序列核函数
  • 3.2.1 字符串核函数
  • 3.2.2 词序列核函数
  • 3.2.3 句子级别核函数
  • 第四章 文本分类技术
  • 4.1 文档表示
  • 4.2 文本分类的定义
  • 4.2.1 两分类问题
  • 4.2.2 多类问题
  • 4.2.3 多标记问题
  • 4.3 特征重构
  • 4.3.1 词干抽取(stemming)
  • 4.3.2 项聚类
  • 4.3.3 潜在语义标引
  • 第五章 系统实现及关键技术
  • 5.1 系统设计与实现
  • 5.1.1 开发环境介绍
  • 5.1.2 系统结构设计
  • 5.1.3 系统界面设计
  • 5.2 文档集的选择和描述
  • 5.2.1 文档的处理
  • 5.2.2 文档类的设计
  • 5.3 句集合核函数和句序列核函数
  • 5.3.1 句集合核函数模型与算法
  • 5.3.2 句序列核函数
  • 5.4 基于 SVM的最优搜索模型
  • 5.5 对 LIBSVM软件包的改进
  • 5.5.1 LIBSVM算法
  • 5.5.2 对 LIBSVM源代码的改进
  • 第六章 实验结果及数据分析
  • 6.1 句集合核函数分类性能实验
  • 6.2 基于最优搜索策略的检索实验
  • 第七章 结论及展望
  • 参考文献
  • 攻硕期间取得的研究成果
  • 相关论文文献

    • [1].基于组合核函数的高校经济困难生分类[J]. 安徽工业大学学报(自然科学版) 2020(01)
    • [2].核函数在不规则人脸识别中的应用[J]. 计算机与数字工程 2019(06)
    • [3].图核函数研究现状与进展[J]. 安徽大学学报(自然科学版) 2017(01)
    • [4].浅海环境下的声学灵敏度核函数研究[J]. 南京大学学报(自然科学) 2017(01)
    • [5].组合核函数优化的稀疏最小二乘支持向量机[J]. 太赫兹科学与电子信息学报 2017(03)
    • [6].增量支持向量机核函数的优化[J]. 计算机系统应用 2017(08)
    • [7].对支持向量机混合核函数方法的再评估[J]. 统计研究 2015(02)
    • [8].混合核函数研究及其在数据建模领域应用进展[J]. 计算机仿真 2015(07)
    • [9].基于混合核函数支持向量机的风电机组发电机温度预警方法[J]. 华电技术 2020(05)
    • [10].装备费用预测中的混合核函数支持向量机[J]. 数学的实践与认识 2014(16)
    • [11].基于混合核函数支持向量机的回归模型[J]. 合肥学院学报(自然科学版) 2013(02)
    • [12].基于组合核函数支持向量机的人脸识别[J]. 重庆理工大学学报(自然科学) 2013(06)
    • [13].基于混合核函数的支持向量机在人脸识别中的应用研究[J]. 电子设计工程 2013(11)
    • [14].基于分段核函数的支持向量机及其应用[J]. 现代电子技术 2013(16)
    • [15].基于最优核函数支持向量机的费用预测[J]. 控制工程 2012(S1)
    • [16].基于混合核函数的支持向量机[J]. 重庆理工大学学报(自然科学) 2011(10)
    • [17].一种新的自适应组合核函数[J]. 武汉理工大学学报 2009(03)
    • [18].一种混合核函数的支持向量机[J]. 微型机与应用 2017(11)
    • [19].组合核函数支持向量机在个人信用评估中的应用[J]. 黑龙江科技信息 2013(26)
    • [20].基于正交多项式核函数方法[J]. 计算机技术与发展 2012(05)
    • [21].复高斯小波核函数的支持向量机研究[J]. 计算机应用研究 2012(09)
    • [22].基于多核函数的模糊支持向量机学习算法[J]. 重庆师范大学学报(自然科学版) 2012(06)
    • [23].基于混合核函数支持向量机和遗传算法的人脸识别[J]. 计算机应用与软件 2011(04)
    • [24].基于混合核函数支持向量机的齿轮诊断方法研究[J]. 机械传动 2011(09)
    • [25].混合核函数支持向量机在系统建模中的应用[J]. 华东交通大学学报 2010(02)
    • [26].基于极分解下的混合核函数及改进[J]. 模式识别与人工智能 2009(03)
    • [27].基于图像核函数的图像目标识别技术研究[J]. 信号处理 2009(12)
    • [28].超核函数支持向量机[J]. 计算机科学 2008(12)
    • [29].基于加权核函数的雷达目标一维距离像识别[J]. 仪器仪表学报 2008(11)
    • [30].不同核函数对光滑粒子流体动力学计算结果的影响分析[J]. 数学的实践与认识 2020(11)

    标签:;  ;  ;  ;  ;  

    最优搜索理论与支持向量机在信息检索中的应用研究
    下载Doc文档

    猜你喜欢