论文摘要
通过分析现有科技论文管理系统不足和用户需求,提出了论文管理必须深入文本内部对核心段落进行主题标引的观点,采用知识—概念节点—标引主题—文本载体的层次化映射方法,使用户能够对论文的知识进行较细致的标引,能够方便地重用论文知识。在系统的数据结构方面:采用了文档提取结构记录用户摘录的知识文本;采用主题和次要主题所组成的文本主题结构来描述论文的知识主题;采用学科概念网表示论文所属学科的基本知识。在标引算法方面:提出了一种根据概念节点在概念网中位置关系形成主题半径的文本主题标引方法,该方法以读者标记段落作为单独标引处理单位,以各段落的标引结果计算产生全文标引结果,从而达到深入标引科技论文核心段落的目的。该方法包括计算主题半径,排除干扰词,权值调整,最后生成论文的文本主题结构。实验表明本标引方法具有较高的可信度,有较好的识别率。另外系统设置了根据标引结果对概念网进行扩展的模块,以实现符合读者认知特点的学科概念网改造。在论文知识检索方面:在分析论文知识检索需求和现有检索方法的基础上,设计了基于文本主题结构标引的论文知识检索算法,实验表明本文提出的标引方法能够较好地检索到段落内部知识。在系统的个性化实现方面:通过分析读者的阅读习惯及系统平台特点,设计了一种个性化计算方法,本方法引入了相似度校正系数计算读者的重点阅读主题集合,采用Web Services技术作为信息获取途径,实验表明本方法能够较好地计算读者的兴趣主题,并实现了个性化的新知识获取。原型系统实现了4层的映射关系,达到了对论文核心段落知识进行标引的目的。
论文目录
摘要ABSTRACT第一章 绪论1.1 引言1.2 研究背景及意义1.2.1 科技论文的知识处理1.2.2 面临的问题1.2.3 对论文管理系统提出的新要求1.3 相关研究分析1.3.1 文本分类1.3.2 文本挖掘1.3.3 自动文摘1.3.4 文本信息抽取1.4 本文的研究1.4.1 标引方法改进思路1.4.2 研究目的1.4.3 研究内容1.5 论文组织结构第二章 系统模型及总体设计2.1 论文标引管理系统的四级映射关系2.2 科技论文描述结构的确定2.2.1 传统科技论文描述的缺点2.2.2 论文管理新的需求2.2.3 论文要素分析2.2.4 科技论文的描述2.3 学科概念网的构建2.3.1 计算机领域知识结构特点2.3.2 概念网的存储结构2.4 知识处理总体设计思路2.5 本章小结第三章 基于学科概念网的论文主题标引及信息服务3.1 主题标引处理流程3.2 段落主题标引3.2.1 分词3.2.2 概念词消歧3.2.3 干扰词的排除3.3 权值调整3.3.1 权值调整原理3.3.2 权值调整3.3.3 权值调整实例说明3.4 论文主题的识别3.4.1 主题识别步骤3.4.2 结果修正和概念网的扩展3.5 标引方法实验3.6 个性化知识推送3.6.1 系统个性化知识推送方法研究3.6.2 Web Services 技术简介3.6.3 实现方式3.7 个性计算实验及分析3.8 本章小结第四章 论文知识检索方法研究4.1 传统的资源管理方式和检索方法4.1.1 目录式的资源管理方式的缺陷4.1.2 信息检索4.2 基于论文主题资源的管理4.3 检索方法研究4.3.1 基于关键字的标记段落检索4.3.2 基于论文主题的语义检索方法4.3.3 检索实验4.4 本章小结第五章 原型系统设计与实现5.1 系统功能分析5.2 开发平台及数据库5.2.1 开发平台5.2.2 数据库5.3 系统实现技术5.3.1 树形目录展现5.3.2 Google Web APIs 的使用5.3.3 文献页码长度的获取5.3.4 算法时间效率分析5.4 本章小结第六章 结束语6.1 论文及研究工作总结6.2 需进一步研究的问题参考文献致谢攻读学位期间的主要研究成果
相关论文文献
标签:主题半径论文; 主题标引论文; 个人知识管理论文; 个性化论文; 概念网论文;