• 基于大规模语料的中文新词识别技术研究

    基于大规模语料的中文新词识别技术研究

    论文摘要中文新词识别是指从未标注文本语料中抽取新词并识别其属性的过程,是中文信息处理领域的一项基础任务,其识别结果直接影响着分词、句法分析的处理性能,同时亦在信息抽取及机器翻译...
  • 基于条件随机域的Web信息抽取研究

    基于条件随机域的Web信息抽取研究

    论文摘要随着互联网资源的迅速增长,仅仅依靠浏览器以及基于关键字检索查询的搜索引擎,已远不能满足互联网用户的信息需求,Web信息抽取应运而生。本文以条件随机域模型为主要研究内容,...
  • 基于CRF模型的汉语介词短语识别

    基于CRF模型的汉语介词短语识别

    论文摘要介词短语是汉语中一种重要的短语类型。介词短语识别可以缩小句子中心动词的选择范围;可以简化句子结构,降低后续句法分析的难度;在基于模板的翻译中,它还能为模板匹配提供方便。...
  • 基于统计学习的中文组块分析技术研究

    基于统计学习的中文组块分析技术研究

    论文摘要随着网络时代的来临和自然语言处理技术在处理大量网络信息文本中的广泛应用,自动、高效的中文组块分析技术作为浅层句法分析的代表,成为了对信息进行处理与理解的关键技术,对于语...
  • 汉语句子的组块识别研究

    汉语句子的组块识别研究

    论文摘要组块识别是自然语言浅层句法分析的重要任务之一。它通过采用“分而治之”的策略把句子解析成较小的单元来简化句子结构,并为进一步揭示这些单元间的句法关系提供基础。组块识别作为...
  • 时间表达式识别与归一化研究

    时间表达式识别与归一化研究

    论文摘要在自然语言中,时间是一种重要的语义载体。人们通过了解一个事件的开始、发展和结束的时间信息,把握事件发展的全过程。时间信息识别在信息抽取、问答系统、摘要生成、话题跟踪和检...