潜在语义分析在跨语言信息检索中的应用研究

潜在语义分析在跨语言信息检索中的应用研究

论文摘要

随着英特网的发展,人们越来越多的面临怎样有效地查找相关外语文件的问题。在互联网发展初期,网络内容以英文为主,上网用户也多来自美、英等发达国家,但此后,来自其他国家的网站和用户数逐渐增加,给传统的以英语为唯一语言的信息检索技术带来新的问题。为此研究直接用用户的母语进行信息检索成为必要,进而研究双语言或多语言的跨(交叉)语言信息检索也成为一个热门的话题。跨语言信息检索研究的是基于一种自然语言构造的查询搜索任意语言文档的方法,因为单一语言信息检索的研究已经比较成熟,而且已经实用化,因此目前跨语言信息检索技术的基本框架都是从单语言信息检索继承发展而来。但由于不同的语言背后隐藏着差别很大的文化背景和人文习惯,机器翻译的效果至今不能满足人们的要求,所以仅仅依靠单语言检索的方法不能满足解决跨语言信息检索中的语义匹配等深层次问题。本文首先介绍了跨语言信息检索的研究内容和相关技术及其国际评测标准,接着分析了潜在语义分析的原理和建模方法以及相关的应用。然后根据潜在语义分析的语言无关性等特点,用其分析双语文本,建立词语翻译模型,并引入双向翻译思想,提高翻译准确率。随后针对传统跨语言信息检索中查询扩展方法的缺陷,结合k-means聚类和潜在语义分析模型对文本和词语表示的优势,提出一种新的扩展方法,减轻翻译出错或翻译歧义对查询结果的影响,最后更新了传统的查询词权重计算公式,提高了检索的平均准确率。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 跨语言信息检索的研究现状
  • 1.3 论文的主要研究内容
  • 1.4 论文的结构
  • 第二章 跨语言信息检索技术
  • 2.1 检索模型
  • 2.1.1 布尔模型
  • 2.1.2 向量空间模型
  • 2.1.3 概率模型
  • 2.2 语种转化方法
  • 2.2.1 提问式翻译方法
  • 2.2.2 文献翻译方法
  • 2.2.3 中间语种翻译方法
  • 2.3 评测标准
  • 2.3.1 信息检索系统的评价
  • 2.3.2 相关国际会议
  • 2.4 跨语言信息检索的应用
  • 2.5 本章小结
  • 第三章 潜在语义分析
  • 3.1 潜在语义分析的基本思想
  • 3.2 潜在语义分析的实现
  • 3.2.1 奇异值分解法
  • 3.2.2 基于概率的构造法
  • 3.2.3 其他构造法
  • 3.3 潜在语义分析的特点
  • 3.3.1 潜在语义分析的优点
  • 3.3.2 潜在语义分析的不足
  • 3.4 潜在语义分析的应用
  • 3.5 本章小结
  • 第四章 基于潜在语义分析的双向翻译模型
  • 4.1 翻译策略的研究
  • 4.1.1 基于词典的策略
  • 4.1.2 基于语料库的策略
  • 4.1.3 词的歧义研究
  • 4.2 双向翻译思想
  • 4.3 模型实现的基本步骤
  • 4.3.1 双语空间的建立
  • 4.3.2 排歧义翻译
  • 4.3.3 实现技术
  • 4.4 实验结果及分析
  • 4.5 本章小结
  • 第五章 基于潜在语义分析的跨语言查询扩展方法
  • 5.1 查询扩展技术
  • 5.1.1 单语言查询扩展技术
  • 5.1.2 跨语言信息检索中的查询扩展
  • 5.2 方法具体实现步骤
  • 5.2.1 双语空间的建立
  • 5.2.2 同义词扩展
  • 5.2.3 聚类求扩展文本集合
  • 5.2.4 计算目标语种扩展词
  • 5.2.5 补充翻译
  • 5.2.6 权重计算
  • 5.3 实验设计和结果分析
  • 5.3.1 数据集和测评方法
  • 5.3.2 扩展规模
  • 5.3.3 实验结果及分析
  • 5.4 本章小结
  • 第六章 总结
  • 6.1 本文的主要工作
  • 6.2 本文的主要贡献
  • 6.3 下一步工作
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文
  • 相关论文文献

    • [1].关于“信息检索学”是否存在问题的探讨[J]. 中国索引 2012(03)
    • [2].从新视角开展信息检索建模研究[J]. 中国出版 2020(08)
    • [3].在线健康信息检索行为实验研究内容梳理及启示[J]. 图书情报工作 2020(03)
    • [4].情境感知视角下的信息检索发展研究[J]. 图书情报导刊 2020(04)
    • [5].计算机信息检索对图书情报的影响分析[J]. 中国新通信 2020(17)
    • [6].任务情境下的儿童信息检索行为研究[J]. 图书馆理论与实践 2019(05)
    • [7].企业用户信息检索模式研究[J]. 中国管理信息化 2019(18)
    • [8].探讨现代信息检索对图书馆信息服务的影响[J]. 办公室业务 2019(22)
    • [9].“信息检索与利用”混合式教学中实践教学作业设置探讨[J]. 江苏科技信息 2018(13)
    • [10].基于蓝墨云班课的翻转课堂教学实践——以高职“信息检索”课程为例[J]. 中国信息技术教育 2017(01)
    • [11].信息检索在公安管理中的应用探讨[J]. 山西青年 2017(02)
    • [12].检索是一种素养[J]. 大学生 2017(07)
    • [13].自学检索[J]. 大学生 2017(10)
    • [14].信息检索服务小微企业的探析——基于“大众创业、万众创新”背景[J]. 科技创业月刊 2016(04)
    • [15].网络档案信息检索的元数据设计[J]. 山西档案 2020(01)
    • [16].巧用智能手机拓展高职信息检索课堂[J]. 北极光 2019(03)
    • [17].跨语言信息检索中的最关联英文语义翻译选取[J]. 现代电子技术 2017(12)
    • [18].雨课堂在《信息检索与利用》课程教学中的应用实践[J]. 中国教育信息化 2017(20)
    • [19].研究生与本科生信息检索焦虑研究[J]. 图书馆学刊 2015(11)
    • [20].网络环境下的图像信息检索行为的现状调查及优化对策[J]. 科教文汇(上旬刊) 2014(10)
    • [21].微信辅助信息检索教学的SWOT分析[J]. 中国新通信 2014(24)
    • [22].开放网络知识的信息检索与数据挖掘探究[J]. 电脑迷 2016(09)
    • [23].高校图书馆读者信息检索竞赛活动研究[J]. 新世纪图书馆 2014(10)
    • [24].跨语言信息检索在搜索引擎中的应用[J]. 中小企业管理与科技(上旬刊) 2013(04)
    • [25].艺术信息检索[J]. 大舞台 2012(03)
    • [26].我国企业信息检索存在的通病与对策[J]. 重庆与世界(学术版) 2012(07)
    • [27].财经院校经济信息检索与利用教育模式的构建[J]. 高等财经教育研究 2012(04)
    • [28].网络环境下高职院校信息检索教育的思考[J]. 科技信息 2009(31)
    • [29].2006-2007年国外用户信息检索行为研究述评[J]. 图书馆建设 2008(03)
    • [30].医科院校信息检索教育形式多样化的研究[J]. 科技情报开发与经济 2008(18)

    标签:;  ;  ;  ;  

    潜在语义分析在跨语言信息检索中的应用研究
    下载Doc文档

    猜你喜欢