Web挖掘技术在东亚植物遗传资源管理系统中的应用研究

Web挖掘技术在东亚植物遗传资源管理系统中的应用研究

论文摘要

为促进东亚地区植物遗传资源的保护和利用,国际植物遗传资源研究所(IPGRI)与东亚各国有关研究机构决定建立“东亚植物遗传资源协作网”(EA-PGR)Web信息管理系统。 EA-PGR的Web信息管理系统的信息是分类进行管理的,管理员要处理大量来自IPGRI的静态Web文本,然后把它们按类上传到Web信息管理系统中,这些Web文本的组织往往处于混乱的状态,采用人工分类,工作量既大,效率又低。正是出于需要对Web文本进行分类管理的目的,作者研究了Web文本的自动分类技术。本论文研究结果如下: (1) 分析了Web文本分类的三个重要技术:特征词提取、特征赋权、特征选择方法的IG、CHI、期望交叉熵等6种评估函数。对来自IPGRI的Web文本集进行了系统测试,分析了各种评估函数对不同分类器的优劣。 (2) 研究了Web文本分类算法:类中心向量、KNN、朴素贝叶斯、SVM等几种分类器,并对KNN和SVM两种分类器在标准语料库和来自IPGRI的Web文本集进行了实验比较分析,得出SVM是比KNN更好的分类器。 (3) 作为Web文本自动分类技术研究的结果,采用VC++设计与实现了基于内容的中英文Web文本自动分类系统。该系统具有支持KNN和SVM两种分类器、多种特征选择方法、兼类分类、自定义特征空间维数和分类结果评测曲线、直方图显示等特点。 (4) IPGRI为了在成员国之间开展多个领域的学术交流和合作活动,决定建立“东亚植物遗传资源协作网”的网站。作者用ASP. NET和ADO. NET技术,结合SQL Server 2000数据库系统,用C#语言开发了基于ASP. NET的信息管理系统。在此基础上,利用Web文本自动分类技术研究结果把分好类的Web文本和其他信息进行有效的发布和共享,实现了EA-PGR相关信息和数据的动态管理与发布。

论文目录

  • 摘要
  • ABSTRACT
  • 目录
  • 第一章 前言
  • 1.1 研究背景和意义
  • 1.2 国内外研究现状
  • 1.3 研究目标和内容
  • 1.4 论文组织
  • 第二章 WEB文本分类过程概述
  • 2.1 文本分类的概念
  • 2.2 文本自动分类的实现过程
  • 2.3 文本的预处理与分词
  • 2.4 分类器的设计与训练
  • 2.5 文本分类的性能评价
  • 2.6 实验用到的文本集
  • 第三章 WEB文本分类的特征提取、特征选择与实验比较
  • 3.1 WEB文本的特征提取
  • 3.2 WEB文本分类中的特征赋权
  • 3.3 WEB文本分类中的特征选择
  • 3.4 特征选择实验比较与结论
  • 第四章 WEB文本分类算法与实验比较
  • 4.1 类中心向量分类法
  • 4.2 KNN分类法
  • 4.3 NAiVE BAYES分类方法
  • 4.4 SVM分类法
  • 4.5 KNN和SVM的算法比较与分析
  • 第五章 WEB文本分类系统的设计与实现
  • 5.1 系统结构简介
  • 5.2 各功能模块
  • 第六章 东亚植物遗传资源管理系统的设计与实现
  • 6.1 系统设计
  • 6.2 工作原理和主要技术
  • 第七章 结论与展望
  • 7.1 结论
  • 7.2 展望
  • 参考文献
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].我国药用植物遗传资源法律保护探析[J]. 绿色科技 2020(04)
    • [2].论粮农植物遗传资源开源保护困境与出路[J]. 法治研究 2020(03)
    • [3].粮农植物遗传资源视阈下的农民权客体论[J]. 宁波大学学报(人文科学版) 2020(04)
    • [4].我国加入《粮食和农业植物遗传资源国际条约》的选择和建议[J]. 植物遗传资源学报 2019(05)
    • [5].《粮食和农业植物遗传资源国际条约》的晚近发展及启示[J]. 青海社会科学 2016(05)
    • [6].林业植物遗传资源产权配置问题研究[J]. 福建论坛(人文社会科学版) 2012(04)
    • [7].中国植物遗传资源引进、引出或流失历史与现状[J]. 中央民族大学学报(自然科学版) 2011(02)
    • [8].《粮食和农业植物遗传资源国际条约》实施进展[J]. 植物遗传资源学报 2011(04)
    • [9].我国农业植物遗传资源知识产权保护现状与对策研究[J]. 安徽农业科学 2011(32)
    • [10].我国农业植物遗传资源权利保护分析[J]. 江淮论坛 2009(06)
    • [11].试论云南省植物遗传资源保护的法律完善[J]. 昆明理工大学学报(社会科学版) 2008(02)
    • [12].植物遗传资源国际交换的新规则[J]. 中国种业 2008(08)
    • [13].《粮食和农业植物遗传资源国际条约》与中国的选择[J]. 法制博览 2017(36)
    • [14].植物品种权与农民权利的协调——植物遗传资源知识产权制度的重大关切[J]. 温州大学学报(社会科学版) 2012(05)
    • [15].粮食安全与农业可持续发展的国际法保障——《粮食和农业植物遗传资源国际条约》评析[J]. 法商研究 2009(01)
    • [16].植物遗传资源核心种质新概念与应用进展[J]. 种子 2008(05)
    • [17].俄罗斯粮食和农业植物遗传资源概况[J]. 现代农业科技 2014(01)
    • [18].植物遗传资源核心种质研究进展[J]. 食品安全质量检测学报 2014(11)
    • [19].《植物遗传资源学报》创刊10周年贺词[J]. 植物遗传资源学报 2010(01)
    • [20].世界粮食作物多样化面临威胁[J]. 农村实用技术 2010(12)
    • [21].药用植物遗传资源保护与应用[J]. 中国现代中药 2019(11)
    • [22].《粮食和农业植物遗传资源国际条约》与《名古屋议定书》比较研究[J]. 植物遗传资源学报 2013(06)
    • [23].五节芒核心种质的构建研究概述[J]. 作物研究 2010(02)
    • [24].《粮食和农业植物遗传资源国际条约》的实施进展和改革动态——以获取和惠益分享多边系统为中心[J]. 植物遗传资源学报 2018(06)
    • [25].国际公约背景下我国农民权实现的对策分析[J]. 农业环境与发展 2012(04)
    • [26].关于我国林业植物遗传资源保护的思考[J]. 林业资源管理 2008(03)
    • [27].粮食作物多样化面临威胁[J]. 农产品市场周刊 2010(43)
    • [28].粮食和农业植物遗传资源国际条约(ITPGRFA)介绍近期工作进展[J]. 世界农业 2016(03)
    • [29].世界粮食作物多样化面临威胁[J]. 世界热带农业信息 2010(12)
    • [30].核心种质在蔬菜育种上的应用与展望(综述)[J]. 亚热带植物科学 2012(03)

    标签:;  ;  ;  

    Web挖掘技术在东亚植物遗传资源管理系统中的应用研究
    下载Doc文档

    猜你喜欢