基于潜在语义分析的智能搜索技术研究

基于潜在语义分析的智能搜索技术研究

论文摘要

近年来互联网飞速发展,已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息源。搜索引擎为用户提供了友好的检索接口,能帮助人们从浩瀚的数据中抽取出对用户有用的信息,能极大地节省用户的查询时间。互联网上绝大多数的信息是以文本的形式保存的,互联网上文本信息的指数级增长给搜索引擎技术带来了巨大的挑战,人们越来越难以快速准确地从网上搜索到相关信息。由于自然语言中多词同义、一词多义等不确定性因素存在,相同概念可以有多种不同的表述方式。传统的基于关键词字符匹配的搜索引擎中,参与匹配的只有外在的表现形式,而非它们所表达的全部概念,用户很难简单地用关键词或关键词串来真实地表达真正需要查询的内容。把搜索引擎技术从关键词匹配的层面提高到语义的层面,从语义意义上智能地认知和处理用户的查询请求成为当前搜索引擎技术的研究热点。本文从智能搜索建模的角度出发结合潜在语义分析技术,研究了搜索引擎中文档处理、查询处理以及最后的信息匹配处理。在此基础上,对潜在语义空间中权值从概率角度进行了分析与改进,使其更能体现出文档间、文档与词汇间的语义关系;对用户查询进行语义扩展,补充了用户输入信息不足或与索引词汇不匹配的问题;对用户搜索结果不理想进行调整,提出二次搜索的策略改善搜索结果使其更贴近用户要求。最后文本设计并实现了基于潜在语义分析的智能搜索系统验证了算法可以在一定程度上搜索引擎对语义的理解,并获得较高的准确率与查准率。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题的研究背景及意义
  • 1.2 国内外研究现状
  • 1.3 研究内容及论文结构
  • 第2章 智能搜索相关技术
  • 2.1 智能搜索技术
  • 2.2 信息检索模型
  • 2.3 潜在语义分析模型
  • 2.3.1 潜在语义分析的基本思想
  • 2.3.2 奇异值分解
  • 2.3.3 潜在语义分析模型示例
  • 2.4 本章小结
  • 第3章 智能搜索系统建模
  • 3.1 智能搜索系统建模概述
  • 3.2 文档处理模块
  • 3.2.1 文档分词与词性标注
  • 3.2.2 文档关键词选取
  • 3.2.3 词汇-文档矩阵生成
  • 3.2.4 索引生成
  • 3.3 查询处理模块
  • 3.3.1 查询分词与关键词选取
  • 3.3.2 查询扩展
  • 3.3.3 查询向量生成
  • 3.4 匹配处理模块
  • 3.4.1 词汇-文档矩阵的更新
  • 3.4.2 相似性度量
  • 3.4.3 二次搜索
  • 3.5 本章小结
  • 第4章 基于潜在语义分析的算法
  • 4.1 潜在语义空间中权重计算方法
  • 4.1.1 潜在语义空间权值计算方法
  • 4.1.2 概率权值法
  • 4.2 潜在语义空间的构造
  • 4.3 基于语义的查询扩展算法
  • 4.3.1 词汇间相关性的计算
  • 4.3.2 基于查询内容的扩展词选取策略
  • 4.3.3 扩展词的权值确定
  • 4.4 二次搜索策略
  • 4.5 本章小结
  • 第5章 潜在语义分析系统实现与评价
  • 5.1 LSA 搜索系统总体设计
  • 5.2 LSA 搜索系统设计与实现
  • 5.2.1 LSA 搜索系统文档集的选取
  • 5.2.2 LSA 搜索系统的实现
  • 5.3 实验结果与分析
  • 5.3.1 概率权值法实验
  • 5.3.2 查询扩展实验
  • 5.4 本章小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表的论文和取得的科研成果
  • 致谢
  • 相关论文文献

    • [1].统一智能搜索处理技术的研究与应用[J]. 自动化与仪器仪表 2017(05)
    • [2].人工智能畅想曲[J]. 中国信息技术教育 2017(07)
    • [3].智能搜索:梦想照进现实[J]. 互联网周刊 2009(03)
    • [4].远程服务渠道统一运营模式下的智能搜索技术实现[J]. 电子测试 2015(23)
    • [5].支持评价类问题与电影智能搜索的问答系统构建[J]. 大连理工大学学报 2011(S1)
    • [6].基于本体的领域智能搜索技术研究[J]. 黑龙江科技信息 2008(15)
    • [7].Lucidworks宣布与Tobesoft签署韩国独家分销商协议[J]. 电子产品可靠性与环境试验 2019(S1)
    • [8].基于混合引力智能搜索的分布式电源并网优化[J]. 太阳能学报 2020(08)
    • [9].论多特征智能搜索技术在视频分析中的应用[J]. 广东公安科技 2017(01)
    • [10].视频监控目标智能搜索技术发展前景[J]. 数码设计 2017(11)
    • [11].视频监控目标智能搜索技术发展前景[J]. 中国公共安全 2013(15)
    • [12].链接不是答案:Kngine发布革命性的搜索应用[J]. 现代图书情报技术 2012(06)
    • [13].吴嘉[J]. 上海信息化 2020(07)
    • [14].面向无载体信息隐藏的映射关系智能搜索方法[J]. 信息安全学报 2020(03)
    • [15].智能搜索技术在船舶导航系统中的应用研究概述[J]. 青岛远洋船员职业学院学报 2012(03)
    • [16].智能搜索 程序启动更快速[J]. 网友世界 2010(16)
    • [17].移动Agent在智能搜索中的应用[J]. 中小企业管理与科技(下旬刊) 2011(04)
    • [18].微软将开发个性化智能搜索产品Emporia[J]. 硅谷 2011(12)
    • [19].基于军事应用的网络情报智能搜索技术初探[J]. 文存阅刊 2018(11)
    • [20].电力调度知识领域的智能搜索关键技术研究[J]. 中国科技信息 2018(20)
    • [21].船舶导航系统对智能搜索技术的应用分析[J]. 中国水运(下半月) 2015(05)
    • [22].线上订餐系统智能搜索算法研究[J]. 饮食科学 2017(18)
    • [23].热地带 引领在线旅游行业智能搜索新潮流[J]. 旅游纵览(行业版) 2012(06)
    • [24].一种考虑可能区域和智能搜索相结合的定位算法[J]. 山东大学学报(理学版) 2010(11)
    • [25].相关对象组合匹配模型及解耦递阶智能搜索[J]. 科研管理 2009(01)
    • [26].应用智能搜索 实现数据挖掘[J]. 中国传媒科技 2009(11)
    • [27].调频广播电台智能搜索方法研究及实现[J]. 广播与电视技术 2019(02)
    • [28].基于互联网“众包监测”的黑广播信号智能搜索识别系统[J]. 中国无线电 2017(05)
    • [29].智能搜索系统个性化服务的研究[J]. 电子商务 2011(10)
    • [30].基于语义词汇的智能搜索系统研究[J]. 洛阳师范学院学报 2010(02)

    标签:;  ;  ;  ;  

    基于潜在语义分析的智能搜索技术研究
    下载Doc文档

    猜你喜欢