面向阅读的论文主题标引管理系统研究

面向阅读的论文主题标引管理系统研究

论文摘要

通过分析现有科技论文管理系统不足和用户需求,提出了论文管理必须深入文本内部对核心段落进行主题标引的观点,采用知识—概念节点—标引主题—文本载体的层次化映射方法,使用户能够对论文的知识进行较细致的标引,能够方便地重用论文知识。在系统的数据结构方面:采用了文档提取结构记录用户摘录的知识文本;采用主题和次要主题所组成的文本主题结构来描述论文的知识主题;采用学科概念网表示论文所属学科的基本知识。在标引算法方面:提出了一种根据概念节点在概念网中位置关系形成主题半径的文本主题标引方法,该方法以读者标记段落作为单独标引处理单位,以各段落的标引结果计算产生全文标引结果,从而达到深入标引科技论文核心段落的目的。该方法包括计算主题半径,排除干扰词,权值调整,最后生成论文的文本主题结构。实验表明本标引方法具有较高的可信度,有较好的识别率。另外系统设置了根据标引结果对概念网进行扩展的模块,以实现符合读者认知特点的学科概念网改造。在论文知识检索方面:在分析论文知识检索需求和现有检索方法的基础上,设计了基于文本主题结构标引的论文知识检索算法,实验表明本文提出的标引方法能够较好地检索到段落内部知识。在系统的个性化实现方面:通过分析读者的阅读习惯及系统平台特点,设计了一种个性化计算方法,本方法引入了相似度校正系数计算读者的重点阅读主题集合,采用Web Services技术作为信息获取途径,实验表明本方法能够较好地计算读者的兴趣主题,并实现了个性化的新知识获取。原型系统实现了4层的映射关系,达到了对论文核心段落知识进行标引的目的。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 引言
  • 1.2 研究背景及意义
  • 1.2.1 科技论文的知识处理
  • 1.2.2 面临的问题
  • 1.2.3 对论文管理系统提出的新要求
  • 1.3 相关研究分析
  • 1.3.1 文本分类
  • 1.3.2 文本挖掘
  • 1.3.3 自动文摘
  • 1.3.4 文本信息抽取
  • 1.4 本文的研究
  • 1.4.1 标引方法改进思路
  • 1.4.2 研究目的
  • 1.4.3 研究内容
  • 1.5 论文组织结构
  • 第二章 系统模型及总体设计
  • 2.1 论文标引管理系统的四级映射关系
  • 2.2 科技论文描述结构的确定
  • 2.2.1 传统科技论文描述的缺点
  • 2.2.2 论文管理新的需求
  • 2.2.3 论文要素分析
  • 2.2.4 科技论文的描述
  • 2.3 学科概念网的构建
  • 2.3.1 计算机领域知识结构特点
  • 2.3.2 概念网的存储结构
  • 2.4 知识处理总体设计思路
  • 2.5 本章小结
  • 第三章 基于学科概念网的论文主题标引及信息服务
  • 3.1 主题标引处理流程
  • 3.2 段落主题标引
  • 3.2.1 分词
  • 3.2.2 概念词消歧
  • 3.2.3 干扰词的排除
  • 3.3 权值调整
  • 3.3.1 权值调整原理
  • 3.3.2 权值调整
  • 3.3.3 权值调整实例说明
  • 3.4 论文主题的识别
  • 3.4.1 主题识别步骤
  • 3.4.2 结果修正和概念网的扩展
  • 3.5 标引方法实验
  • 3.6 个性化知识推送
  • 3.6.1 系统个性化知识推送方法研究
  • 3.6.2 Web Services 技术简介
  • 3.6.3 实现方式
  • 3.7 个性计算实验及分析
  • 3.8 本章小结
  • 第四章 论文知识检索方法研究
  • 4.1 传统的资源管理方式和检索方法
  • 4.1.1 目录式的资源管理方式的缺陷
  • 4.1.2 信息检索
  • 4.2 基于论文主题资源的管理
  • 4.3 检索方法研究
  • 4.3.1 基于关键字的标记段落检索
  • 4.3.2 基于论文主题的语义检索方法
  • 4.3.3 检索实验
  • 4.4 本章小结
  • 第五章 原型系统设计与实现
  • 5.1 系统功能分析
  • 5.2 开发平台及数据库
  • 5.2.1 开发平台
  • 5.2.2 数据库
  • 5.3 系统实现技术
  • 5.3.1 树形目录展现
  • 5.3.2 Google Web APIs 的使用
  • 5.3.3 文献页码长度的获取
  • 5.3.4 算法时间效率分析
  • 5.4 本章小结
  • 第六章 结束语
  • 6.1 论文及研究工作总结
  • 6.2 需进一步研究的问题
  • 参考文献
  • 致谢
  • 攻读学位期间的主要研究成果
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    面向阅读的论文主题标引管理系统研究
    下载Doc文档

    猜你喜欢