基于Web文本挖掘的科技项目评价辅助系统研究

基于Web文本挖掘的科技项目评价辅助系统研究

论文摘要

科技项目评价是指按照规范的程序和公允的标准对科技项目进行的评判活动。科技项目在我国科技资源配置中占较大的份额,项目的立项、研究过程及最终成果直接影响和推动着科学技术及社会的发展。因此对科技项目的评价就显得十分重要并越来越受到政府和公众的关注。目前的科技项目评价都是依赖于专家进行人工评审,尚未有自动的评价系统进行参考。本文主要研究科技项目评价指标体系、不同等级评价的样本词库以及基于Web文本挖掘的科技项目模糊评价模型。本文的主要研究工作如下:(1)研究建立比较通用的科技项目评价指标体系,并建立相应的指标评价的样本词库。以科学性、系统性、可测性、简捷性为原则建立一种分层次的科技项目评价指标体系,并对其中的指标项建立起始样本词库,样本词分为三个模糊等级A(优良)、B(一般)、C(较差),并利用知网的同义词进行样本词库的扩充。(2)基于(1)的研究成果,研究提出针对科技项目评价指标项的模糊评价模型。利用科技项目主题搜索引擎从Web上获取待评项目相关的文本信息,基于文本挖掘将其根据评价指标体系进行分类显示,并通过字符串匹配和多层次优化的句子相似度计算得到各项Web信息针对相应指标项的模糊评价,并依照权威度分配权重,利用加权和得到科技项目评价指标项的评价结果。(3)基于物元—层次原理研究提出一种综合的科技项目模糊评价模型。该模型针对物元分析法未考虑多层次方面的缺陷,通过将物元分析和层次分析相结合来对科技项目进行评价,极大提高了综合评价的准确度。本文最终实现了系统的原型,并通过样例测试验证了上述成果的可行性,为科技项目评价在一定程度上提供了参考。

论文目录

  • 摘要
  • ABSTRACT
  • 第1章 绪论
  • 1.1 科技项目评价的研究背景
  • 1.1.1 科技项目评价概述
  • 1.1.2 国内外相关研究现状
  • 1.2 Web文本挖掘概述
  • 1.2.1 Web数据挖掘
  • 1.2.2 Web文本挖掘
  • 1.3 本文的编写与组织
  • 第2章 科技项目评价相关技术方法概述
  • 2.1 Web文本挖掘相关技术
  • 2.1.1 字符串的匹配
  • 2.1.2 分词技术
  • 2.2 句子相似度
  • 2.3 物元模型和层次模型
  • 2.4 本章小结
  • 第3章 科技项目评价指标体系和样本库研究
  • 3.1 科技项目评价指标体系的研究
  • 3.1.1 传统科技项目评价的指标体系
  • 3.1.2 科技项目评价指标体系的设计和构建
  • 3.2 科技项目样本库的研究
  • 3.2.1 科技项目信息的采集
  • 3.2.2 科技项目指标信息分类
  • 3.2.3 指标等级判定
  • 3.3 本章小结
  • 第4章 科技项目指标评价方法研究
  • 4.1 传统的句子相似度计算方法分析
  • 4.1.1 TF-IDF
  • 4.1.2 词性划分和差额法
  • 4.2 改进的句子相似度计算方法
  • 4.2.1 预处理
  • 4.2.2 候选语句筛选
  • 4.2.3 分词和词性标注
  • 4.2.4 带权二分图最大匹配算法
  • 4.3 实验验证及其结果分析
  • 4.3.1 实验准备
  • 4.3.2 实验过程和结果分析
  • 4.4 本章小结
  • 第5章 科技项目综合评价方法研究
  • 5.1 综合评价概述
  • 5.2 建立物元—层次模型
  • 5.2.1 指标值的无量纲化处理
  • 5.2.2 指标权重的确定
  • 5.2.3 物元-层次综合评价方法
  • 5.3 科技项目评价实例
  • 5.3.1 实例评价
  • 5.3.2 结果分析
  • 5.4 本章小结
  • 第6章 科技项目评价辅助系统设计与原型实现
  • 6.1 科技项目评价辅助系统设计
  • 6.1.1 系统设计目标及总体架构
  • 6.1.2 系统功能描述
  • 6.2 科技项目信息获取模块
  • 6.2.1 信息获取模块功能设计
  • 6.3 信息预处理模块
  • 6.3.1 预处理模块功能设计
  • 6.3.2 中文分词与词性标注
  • 6.4 科技项目评价模块
  • 6.4.1 科技项目文本信息分类
  • 6.4.2 科技项目单项指标模糊评价
  • 6.4.3 科技项目综合指标模糊评价
  • 6.5 系统特色及应用效果
  • 第7章 总结与展望
  • 7.1 总结
  • 7.2 展望
  • 致谢
  • 参考文献
  • 附录
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于Web文本挖掘的科技项目评价辅助系统研究
    下载Doc文档

    猜你喜欢