
论文摘要
随着计算机与通讯技术的飞速发展,信息量呈指数式增长,这使得稿件数量极度膨胀,研究领域不断细化,造成稿件分类的周期延长,论文评审速度减慢,效率降低。同时,缩短稿件评审周期、加快其处理流程已成为新时代期刊杂志发展的趋势。对此,本文研究稿件分类工作,将其智能化,设计稿件分类决策支持系统,提高稿件分类的效率,这对加快稿件评审工作,促进期刊杂志业的发展具有重要意义。本文首先论述决策支持系统的概念、特点、功能及体系结构,文本分类的处理流程及常用算法,并阐述了多分类器融合的组合方式及融合算法。然后,对稿件分类决策支持系统进行需求分析,设计系统的流程及架构体系—三部件结构,即数据库、模型库及人机接口。根据稿件分类的决策流程,设计的模型库主要包括预处理模型库、基于向量空间模型的文本表示模型库、基于文档频度模型的特征值提取模型库、单分类器模型库、分层技术及保持法测试模型,分类结果评估模型,其中单分类器模型库包含朴素贝叶斯分类模型、KNN分类模型、中心向量比较分类模型,并对KNN分类模型进行了改进设计。针对不同单分类器模型可能存在分类结果不一致的问题,根据模型的输出具有可度量性的特点,将群决策理论运用于多分类器融合中,采用混合组合方式,运用投票表决体制和社会选择函数设计多分类器融合模型,解决单分类器模型之间的矛盾。根据各类模型的设计,建立模型库的文件库和字典库,设计模型库管理系统,实现对模型库的有效管理。最后,利用C#语言,.NET框架开发实现系统的数据库和模型库。在单分类器模型开发过程中,针对朴素贝叶斯分类模型的输出问题进行修正。本文从管理科学与工程国际会议上收集已分好类别的955篇稿件,用于测试系统的可行性和实用性,并着重分析各分类器及多分类器融合模型的性能。实验结果表明,当训练集量大时,系统的分类效果较好;同一的训练集下,文本预处理方式对分类效果影响不大;改进的KNN模型明显提高了分类精度,而该算法中,K值的选取并不是越大,分类效果越优;就各分类器的分类效果而言,朴素贝叶斯模型较优,而本文提出的基于群决策理论的多分类器融合算法实现简单,且有效地提高了分类精度。
论文目录
摘要Abstract第1章 绪论1.1 研究背景1.2 国内外相关理论研究现状1.2.1 决策支持系统的研究现状1.2.2 文本分类的研究现状1.3 研究内容和论文结构1.4 研究的目的和意义第2章 决策支持系统与文本分类理论综述2.1 决策支持系统理论综述2.1.1 决策支持系统的定义2.1.2 决策支持系统的特点2.1.3 决策支持系统的功能2.1.4 决策支持系统的体系结构2.2 文本分类理论综述2.2.1 文本分类的定义2.2.2 文本分类的流程2.2.3 文本的预处理2.2.4 文本的表示2.2.5 文本特征项的提取2.2.6 文本分类的算法2.2.7 文本分类器准确性的测试方法2.2.8 文本分类器准确性的评估指标2.3 多分类器融合理论2.3.1 多分类器的组合方式2.3.2 多分类器融合算法2.4 本章小结第3章 稿件分类决策支持系统的分析与设计3.1 基于文本分类的稿件分类决策支持系统的需求分析3.2 基于文本分类的稿件分类决策支持系统的总体设计3.2.1 系统整体的流程设计3.2.2 稿件分类的决策流程设计3.2.3 系统的结构设计3.3 系统的数据库及数据库管理系统的设计3.3.1 数据库设计3.3.2 数据库管理系统的设计3.4 系统的模型库及模型库管理系统的设计3.4.1 预处理模型库的设计3.4.2 基于向量空间模型的文本表示模型库的设计3.4.3 基于文档频度模型的特征值提取模型库的设计3.4.4 单分类器模型库的设计3.4.5 基于群决策理论的多分类器融合模型库的设计3.4.6 基于分层技术及保持法的分类结果测试模型库的设计3.4.7 分类结果评估模型库的设计3.4.8 模型库的文件库和字典库的设计3.4.9 模型库管理系统的设计3.5 系统的人机接口设计3.6 本章小结第4章 稿件分类决策支持系统的实现与实例分析4.1 应用实例背景介绍4.2 系统的开发环境4.3 系统数据库的实现4.4 系统模型库的实现4.4.1 预处理模型的实现4.4.2 向量空间模型的实现4.4.3 文档频度模型的实现4.4.4 单分类器模型的实现4.4.5 群决策理论在多分类器融合模型中的实现4.4.6 分层技术及保持法测试模型的实现4.4.7 分类结果评估模型的实现4.5 系统的运行及分类结果分析4.6 本章小结结论参考文献附录1附录2致谢
相关论文文献
标签:决策支持系统论文; 文本分类论文; 多分类器融合论文; 群决策理论论文;