论文摘要
本文将基于统计的机器学习方法和基于规则的方法有效的结合起来并应用于生物实体识别领域,运用SVM这一统计学习理论的典型代表作为机器学习方法的具体实现,并运用基于转换的错误驱动学习方法对SVM测试得到的结果修正,提高了生物实体识别的准确率和召回率。本文方法首先通过抽取较为丰富的特征集合如单词特征、上下文特征、词性特征、词形特征、核心词特征和停用词特征等,使用JNLPBA发布的训练语料对SVM分类器进行训练,然后使用训练后的SVM模型对JNLPBA公布的测试语料进行生物实体识别。通过对训练语料和测试语料的统计与分析,研究了基于统计的机器学习方法应用于生物实体识别领域所存在的一些问题,如学习器的泛化能力,特征选择问题,外部资源引入问题和数据不均匀现象等等。为进一步提高识别的效果,本文实验利用基于转换的错误驱动学习方法对SVM的标注结果进行校正,转换规则较好地挖掘出生物学文本中的语言现象,进一步提高SVM方法得到的准确率和召回率。通过与其他研究者的比较,本文所采用的方法取得了与很多成熟应用相当的结果。
论文目录
相关论文文献
- [1].条件随机域与上下文线索结合的生物实体识别[J]. 计算机工程 2008(07)
- [2].基于生物网络的普适服务突现的方法与仿真[J]. 系统仿真学报 2008(01)
- [3].环境伦理学中从“是”到“善”的转变[J]. 国外社会科学 2014(06)
- [4].面向专利的化合物和生物实体识别系统[J]. 情报工程 2015(04)
- [5].从“私人语言”到“内在语言”的哲学嬗变[J]. 西安外国语大学学报 2016(02)
- [6].NetRD:一种利用Bing搜索结果补充文献挖掘证据集的工具[J]. 北京生物医学工程 2019(04)
- [7].基于编辑距离和多种后处理的生物实体名识别[J]. 计算机工程 2008(17)
- [8].心理学研究对象的阐述[J]. 学理论 2014(08)
- [9].进化计算[J]. 世界建筑 2009(08)
- [10].美国药师协会评出2011年十大药事[J]. 中国食品药品监管 2012(02)
- [11].基于科学计量方法的生物实体研究方案[J]. 中华医学图书情报杂志 2015(07)
- [12].应用粒子群优化-条件随机域的文本生物实体识别[J]. 西安交通大学学报 2010(12)
- [13].基于生物网络的e-service自进化组合方法研究[J]. 计算机应用研究 2008(04)
- [14].需要层次论在臂丛神经损伤术后护理中的应用[J]. 中国实用医药 2011(20)
- [15].你看见它了吗?[J]. 科学与文化 2009(10)
- [16].微流体数字化技术在生物化学中的应用[J]. 煤炭与化工 2015(02)
- [17].身体的教育学意义[J]. 教育学术月刊 2009(02)
- [18].论《黑暗的心》中的身体意象与身体的政治[J]. 中北大学学报(社会科学版) 2017(05)