• 基于规则的Web文本信息抽取技术的研究

    基于规则的Web文本信息抽取技术的研究

    论文摘要随着因特网技术的迅速发展,网上信息成几何级数增长,如何自动处理这些海量联机文本信息成为目前重要的研究课题。文本信息抽取是指从一段文本中抽取指定的信息(例如事件、事实),...
  • 基于Stacking框架的命名实体识别

    基于Stacking框架的命名实体识别

    论文摘要中文命名实体识别是指识别出文本中特定的实体。它是机器翻译、文本分类、信息检索和自动文摘、自动问答等多种自然语言处理技术的基础。作为信息抽取的基本任务,为了促进其他技术和...
  • 基于最大熵模型的中文命名实体识别方法研究

    基于最大熵模型的中文命名实体识别方法研究

    论文摘要命名实体识别是信息抽取的子任务,同时也是机器翻译、自动问答等多种自然语言处理技术的基础。由于受中文自身特点的限制,中文命名实体识别一直相当困难。为了促进其它中文自然语言...