面向专题的信息搜索与过滤技术研究

面向专题的信息搜索与过滤技术研究

论文摘要

随着互联网信息技术的迅速发展,大约每天就有2000万的新网页诞生,且很多网页的信息熵不高,导致通用搜索引擎的信息覆盖率和检索精度都在迅速下降,因此发展面向专题的信息搜索与收集工具就成为趋势。本文研究的面向专题的Web信息收集与过滤技术是这类工具的核心,围绕专题信息的特点,设计了一套个性化的专题信息查询表现、专题信息查询和专题信息过滤和收集方法,以适应专业用户信息收集的需要,提高信息收集的相关度和收集效率。文中重点对查询请求的提交和表现,以及信息的搜索与过滤策略做了研究。本文以国家863高技术项目现实需求为背景,主要工作和研究内容如下:(1)个性化的查询表现技术,使用户不再为向系统提供简单有限的特征词而烦恼,可以帮助用户更好的表达个人的兴趣专题,定制专题知识库。同时,在信息过滤过程中,专题知识库也为文本过滤提供了匹配基向量。(2)提出基于专题的扩展查询技术,克服了有限个专题特征词的限制,使信息搜索过程中,查询关键词与文本特征不拘泥于形式上的“强吻合”,解决了搜索中存在的“漏搜”现象,最大限度的提高了搜索的查全率。(3)研究了检索中基于深度控制的链接过滤方法和下载控制方法,辅助新的相关信息资源的发现,使用户可以对下载的信息量进行间接的控制,搜集到相关度更大的专题信息。(4)改进了基于内容的文本过滤和基于链接结构相结合的过滤策略,有效的改善了检索中的主题“漂移”和搜索精度不高问题,提高了信息的下载精度。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 选题的依据及课题来源
  • 1.2 国内外研究现状
  • 1.2.1 搜索工具的体系结构研究现状
  • 1.2.2 搜索的人机交互技术研究现状
  • 1.2.3 搜索过滤技术的国内外研究现状
  • 1.3 本文的主要研究内容
  • 1.4 论文的结构
  • 第二章 信息搜索与过滤的关键技术及系统的体系结构研究
  • 2.1 信息搜索与过滤的相关问题
  • 2.1.1 搜索过滤技术的分类
  • 2.1.2 基于关键词的查询简介
  • 2.1.3 主题页面在Web 上的分布特征
  • 2.2 系统的关键技术
  • 2.3 专题信息收集与过滤系统的体系结构
  • 第三章 搜索系统的人机交互设计
  • 3.1 搜索的人机交互相关因素
  • 3.1.1 个性化的人机接口
  • 3.1.2 主题的相关性
  • 3.1.3 搜索请求问题
  • 3.2 人机接口
  • 3.3 搜索请求问题的实现技术
  • 3.3.1 基于专题(Topic-based)的扩展查询
  • 3.3.2 概念之间的关系判定
  • 3.3.3 扩展查询的实现
  • 3.4 查询问题的实现技术
  • 3.4.1 HTML 网页的解析
  • 3.4.2 查询向量的建立
  • 3.4.3 文档的相关度计算
  • 第四章 搜索过滤技术研究
  • 4.1 基于内容的文本过滤及分类技术
  • 4.1.1 基于内容的过滤和聚类预处理
  • 4.1.2 匹配阈值的选取
  • 4.2 深度控制技术
  • 4.2.1 深度控制的实现算法
  • 4.2.2 宽度优先搜索可达搜索判断法
  • 4.3 基于链接分析的搜索过滤技术
  • 4.3.1 基于链接过滤的指标算法
  • 4.3.2 链接评价计算模型
  • 第五章 实验过程与结果分析
  • 5.1 专题信息搜索与过滤系统实现与工作过程
  • 5.2 实验评价指标
  • 5.3 实验与结果分析
  • 5.3.1 实验专题定制
  • 5.3.2 实验结果与分析
  • 5.3.3 系统的整体操作性评价
  • 第六章 结论及展望
  • 6.1 本文的主要研究工作
  • 6.2 今后的工作
  • 致谢
  • 参考文献表
  • 附录A 作者发表的论文
  • 附录B 作者参加的科研项目
  • 相关论文文献

    • [1].基于认知分类的大学生网络健康信息搜索的学习效果研究[J]. 图书情报知识 2020(04)
    • [2].在线信息搜索对目的地感知形象演化影响研究[J]. 旅游学刊 2015(10)
    • [3].“百度无限”全国高校信息搜索大赛[J]. 大学生 2017(08)
    • [4].搜索任务类型对消费者网络信息搜索努力的影响机制——基于自我效能感的中介作用[J]. 营销科学学报 2017(01)
    • [5].互联网搜索引擎的特型展现技术[J]. 网络安全技术与应用 2017(04)
    • [6].市场机遇信息搜索的行为机制研究[J]. 现代情报 2012(02)
    • [7].基于榜样的学习方式在《信息搜索与分析》教学中的应用[J]. 中国信息技术教育 2009(24)
    • [8].虚拟社区零售中信息搜索数量的影响机制研究[J]. 北京工商大学学报(社会科学版) 2013(05)
    • [9].消费者对电子商务企业信任建立过程中信息搜索体验的影响[J]. 管理科学 2009(05)
    • [10].互联网环境下国外健康信息替代搜索研究的回顾与展望[J]. 情报理论与实践 2020(03)
    • [11].国内高校信息搜索大赛的品牌化运作[J]. 高校图书馆工作 2018(03)
    • [12].用户跨屏在线信息搜索意愿影响因素研究——基于信息生态视角[J]. 情报科学 2018(10)
    • [13].团队外部信息搜索的特性及多层次促发因素综述[J]. 情报杂志 2016(06)
    • [14].政策信息[J]. 中国报业 2016(13)
    • [15].国内游客行前信息搜索与目的地满意度评价研究——以黄山风景区为例[J]. 人文地理 2012(06)
    • [16].网络搜索任务类型对消费者信息搜索努力的影响:解释水平的调节作用[J]. 消费经济 2016(02)
    • [17].月度大事[J]. 传媒 2016(13)
    • [18].“人肉搜索”对法律与公德的拷问[J]. 新高考(政治历史地理) 2008(11)
    • [19].论手机信息搜索与高校图书馆信息服务[J]. 情报探索 2014(01)
    • [20].基于时空感知能力的农业信息搜索技术研究[J]. 南方农业学报 2013(01)
    • [21].信息焦虑及相关研究进展[J]. 湖北第二师范学院学报 2017(03)
    • [22].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国药物评价 2019(06)
    • [23].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国医药导刊 2019(11)
    • [24].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国医药导刊 2020(01)
    • [25].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国医药导刊 2020(03)
    • [26].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国药物评价 2020(01)
    • [27].欢迎使用“食药云搜”专业信息搜索APP[J]. 中国医药导刊 2020(04)
    • [28].知识管理在互联网信息搜索行业的应用[J]. 知识管理论坛 2018(04)
    • [29].协同信息搜索行为的触发情景因素探析——基于高校学生个人信息搜索失败情景[J]. 图书情报知识 2016(05)
    • [30].信息搜索过程模型的验证分析[J]. 现代情报 2016(06)

    标签:;  ;  ;  ;  ;  ;  

    面向专题的信息搜索与过滤技术研究
    下载Doc文档

    猜你喜欢