中文数据库自然语言查询技术研究

中文数据库自然语言查询技术研究

论文摘要

中文数据库自然语言查询技术大大简化了人机交互的过程,使用户可以只以应用领域的概念访问数据库。随着各个企业对于数据库应用的需求越来越强烈,对中文数据库自然语言查询技术的研究将具有重要的理论意义和实用价值。由于中文语句的复杂性和多样性,如果我们不对输入语句加以限制,则会为自然语言查询接口的实现带来困难。为此,本文提出受限汉语的概念。并在此基础上,提出了受限汉语文法,同时设计开发了针对招聘系统的系统辞典.机器进行自然汉语理解的第一步操作就是分词。本文采用的分词技术是改进的逆向最大匹配法,结合归右原则技术对分词结果可能存在的二义性进行检测和消除,从而极大限度地保证了分词的精度。利用词法分析的结果,系统在句法分析阶段可以方便的生成查询目标和查询条件,并利用其生成本系统的中间语言。在确立了中间语言数据结构之后,进行关联路径的搜寻。在确立目标实体与条件实体之间的关联路径后,即可形成完整SOL语句。本文对不同关联路径提出了各自的解决方案,并举例加以说明。最后总结了本文的研究内容和创新点,并对未来工作作出了展望。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 绪论
  • 1.1 研究背景及意义
  • 1.2 国内外研究现状及面临的问题
  • 1.2.1 国外研究状况
  • 1.2.2 国内研究状况
  • 1.2.3 中文数据库面临的问题
  • 1.3 本文的主要工作
  • 1.4 论文的组织结构
  • 第二章 系统模型架构和功能
  • 2.1 受限汉语
  • 2.1.1 受限汉语定义
  • 2.1.2 受限汉语文法
  • 2.1.3 受限汉语约束
  • 2.2 系统组织模型
  • 2.2.1 系统的三级抽象模型
  • 2.2.2 系统的功能模块
  • 2.3 系统辞典设计
  • 2.3.1 词类划分
  • 2.3.2 通用辞典设计
  • 2.3.3 专用辞典设计
  • 2.3.4 关联辞典设计
  • 第三章 词法分析与二义性消除
  • 3.1 中文分词的一般方法
  • 3.2 本文的分词方法及特点
  • 3.3 句子对象数组与句型串的生成
  • 3.4 二义性消除
  • 3.4.1 二义性问题
  • 3.4.2 二义性消除算法
  • 第四章 句法分析与中间语言生成
  • 4.1 目标字段与条件字段识别
  • 4.1.1 目标字段识别
  • 4.1.2 条件字段识别
  • 4.2 查询目标生成
  • 4.2.1 简单目标生成
  • 4.2.2 复杂目标生成
  • 4.3 查询条件生成
  • 4.2.1 单层条件生成
  • 4.2.2 多层条件生成
  • 4.2.3 分组条件生成
  • 4.2.4 条件间关系确立
  • 4.4 中间语言生成
  • 4.4.1 中间语言的特点
  • 4.4.2 本文中间语言的数据结构
  • 第五章 中间语言转换成SQL语句
  • 5.1 关联路径搜寻
  • 5.1.1 直接关联路径搜寻
  • 5.1.2 间接关联路径搜寻
  • 5.2 SQL语句的生成与测试
  • 5.2.1 SQL语句的标准语法
  • 5.2.2 本系统SQL语句的生成
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 未来工作
  • 致谢
  • 参考文献
  • 相关论文文献

    • [1].从CNKI三大中文数据库看中国的文献资源共建共享建设[J]. 农业图书情报学刊 2012(03)
    • [2].从联机编目流程谈CALIS中文数据库质量控制[J]. 情报探索 2011(11)
    • [3].三大中文数据库个性化服务研究[J]. 科技情报开发与经济 2011(19)
    • [4].高校图书馆三大中文数据库比较分析与利用——以石河子大学图书馆为例[J]. 农业网络信息 2016(04)
    • [5].科技查新视角下三大中文数据库的比较研究[J]. 现代情报 2011(10)
    • [6].基于中文数据库的胚胎停育文献分布特征及证素分析[J]. 中国民间疗法 2020(22)
    • [7].本刊成为日本JST中文数据库来源期刊[J]. 临床小儿外科杂志 2016(06)
    • [8].1998~2007年声像档案研究论文的统计分析[J]. 云南档案 2009(05)
    • [9].“中华字库”工程——中华民族有史以来规模最大的汉字及少数民族文字整理工作[J]. 中国索引 2013(01)
    • [10].中文检索平台知识发现功能比较研究[J]. 情报探索 2016(01)
    • [11].肝上皮样血管内皮瘤临床特征分析[J]. 求医问药(下半月) 2012(08)
    • [12].消化系统恶性肿瘤术后早期活动安全危险性的文献分析[J]. 解放军护理杂志 2019(06)
    • [13].《基于中文数据库的知识图谱绘制方法及应用:以创新研究论文的分析为例》简介[J]. 浙江树人大学学报(人文社会科学版) 2013(04)
    • [14].湖南省高校图书馆数字资源建设情况调查[J]. 科技情报开发与经济 2015(18)
    • [15].我国大麻滥用的历史和现状[J]. 中国药物依赖性杂志 2015(05)
    • [16].中文数据库分类检索能力研究[J]. 图书馆学研究 2010(03)
    • [17].中文数据库主题检索能力比较研究[J]. 图书馆学研究 2010(11)
    • [18].对中文数据库重复建设问题的分析与思考[J]. 农业网络信息 2008(05)
    • [19].农村互助养老研究综述——基于中国知网中文数据库的成果研究[J]. 社科纵横 2015(12)
    • [20].大数据背景下的中文阅读——以郑州大学河南文献数据库的使用为例[J]. 青年文学家 2016(12)
    • [21].四大中文数据库医药卫生期刊的比较分析[J]. 河南图书馆学刊 2013(06)
    • [22].基于JAVA的图书馆中文查新智能去重系统的研究与实现[J]. 图书馆学研究 2013(17)
    • [23].中文数据库实现分类主题一体化检索的可行性及对策研究[J]. 新世纪图书馆 2012(02)
    • [24].对中文数据库重复建设问题的分析与思考[J]. 现代情报 2008(08)
    • [25].我国卫生行业协同创新研究的描述性系统评价[J]. 中国卫生事业管理 2017(06)
    • [26].国内中文农业数据库综述[J]. 河北农业科学 2008(03)
    • [27].冠心病临床舌诊研究现状[J]. 现代养生 2016(04)
    • [28].国内云计算研究现状与未来[J]. 电脑与信息技术 2014(01)
    • [29].高校学生网络数据库利用状况的比较分析[J]. 林区教学 2008(12)
    • [30].基于中文数据库(CNKI)对小反刍兽疫研究态势的文献分析[J]. 畜牧兽医科技信息 2017(05)

    标签:;  ;  ;  ;  

    中文数据库自然语言查询技术研究
    下载Doc文档

    猜你喜欢