基于仿生模式识别的文本分类技术研究

基于仿生模式识别的文本分类技术研究

论文摘要

互联网时代的来临,使得各种电子文本数据急剧增加,如何快速有效地获取、管理和使用这些文本数据,己经成为信息系统学科迫切需要解决的重要问题。而文本分类技术是信息处理技术的重要研究方向,它是对大量的自然语言文本按照一定的主题类别进行自动分类。传统的文本分类算法(或传统模式识别)都是基于最佳划分的,而仿生模式识别(Biomimetic Pattern Recognition,BPR)是基于“认识”事物而不是“区分”事物,更符合人类认识世界的本质,所以本文把仿生模式识别的理论应用在文本分类中。仿生模式识别是一种不同于传统模式识别的理论方法,它的理论基点是特征空间中同类样本的连续性(不能分裂成两个彼此不邻接的部分)特性。它通过对同类本的在高维特征空间的最佳覆盖来达到识别样本的目的。本文对仿生模式识别的理论基础、数学工具和实现方式进行了深入的研究学习,提出了用超香肠型神经元(Hyper Sausage Neuron,HSN)网络实现基于仿生模式识别的文本分类算法。在HSN网络分类算法的基础之上,本文又提出了三种改进方法。对训练样本冗余和噪声的研究,提出了HSN网络和聚类结合的分类算法;对边界样本存在误识别问题的研究,提出了HSN网络的K最高识别算法;而对特征噪声问题的研究提出了二次特征选择算法。此外,还提出了HSN网络和SVM融合的分类算法。在英文数据上,实验结果表明改进的HSN网络分类算法比传统的KNN和SVM分类性能要好;而在中文数据上,改进的HSN分类算法性能要优于KNN,而HSN和SVM融合后分类效果好于它们中的单个分类性能。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 研究背景和意义
  • 1.2 国内外相关技术研究现状
  • 1.2.1 文本分类在国内外的研究现状
  • 1.2.2 仿生模式识别在国内外的研究现状
  • 1.2.3 文本分类和仿生模式识别面临的突出问题
  • 1.3 本文主要研究内容
  • 1.4 本文的内容组织
  • 第2章 文本分类关键技术
  • 2.1 引言
  • 2.2 文本分类的基本概念
  • 2.2.1 文本分类的定义
  • 2.2.2 文本分类的评价标准
  • 2.3 文本分类的主要技术和方法
  • 2.3.1 文本表示技术
  • 2.3.2 文本特征处理技术
  • 2.3.3 文本分类算法
  • 2.4 文本分类系统结构
  • 2.5 本章小结
  • 第3章 仿生模式识别与多权值神经元网络原理
  • 3.1 引言
  • 3.2 仿生模式识别(BPR)原理简介
  • 3.3 仿生模式识别的数学工具——高维空间几何分析理论
  • 3.3.1 神经元的多维空间几何对应
  • 3.3.2 多维空间几何的基本分析方法
  • 3.4 仿生模式识别的实现方式——多权值神经元人工神经网络
  • 3.5 本章小结
  • 第4章 基于仿生模式识别的文本分类算法
  • 4.1 引言
  • 4.2 仿生模式识别用于文本分类的原理
  • 4.3 基于超香肠神经元网络的文本分类算法
  • 4.3.1 拓扑属性分析和神经元的选择
  • 4.3.2 超香肠神经元网络(HSN Network)文本分类算法
  • 4.4 实验分析
  • 4.4.1 实验设置
  • 4.4.2 实验结果分析
  • 4.5 本章小结
  • 第5章 HSN网络文本分类算法的改进
  • 5.1 引言
  • 5.2 基于聚类的改进方法
  • 5.2.1 相关的聚类技术
  • 5.2.2 基于文本聚类的HSN网络分类算法
  • 5.3 HSN网络的K最高识别方法
  • 5.3.1 HSN神经元覆盖的重叠
  • 5.3.2 K最高识别算法
  • 5.4 基于二次特征选择的改进方法
  • 5.4.1 特征选择分析
  • 5.4.2 二次特征选择的方法
  • 5.5 实验分析
  • 5.5.1 实验设置
  • 5.5.2 实验结果分析
  • 5.6 本章小结
  • 结论
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].重叠特征策略与参数优化的运动想象脑电模式识别[J]. 模式识别与人工智能 2020(08)
    • [2].“模式识别”在高三实验复习教学中的应用[J]. 教学考试 2020(06)
    • [3].利用“模式识别”解“隐形圆”类题[J]. 数理化解题研究 2020(19)
    • [4].数学解题中“模式识别”及其应用——基于“怎样解题表”的实践研究[J]. 初中数学教与学 2020(05)
    • [5].谈“模式识别”在提升学生解题能力方面的应用[J]. 中学数学教学参考 2016(33)
    • [6].模式识别函数组合,巧解函数不等式[J]. 中学数学教学参考 2017(12)
    • [7].重视“模式识别”的作用 提高“变式教学”的效率[J]. 数学通讯 2016(20)
    • [8].精彩优质课堂我做主——《模式识别快乐学习之旅》磨课体会[J]. 发明与创新(教育信息化) 2017(01)
    • [9].模式识别学习“激趣”学习任务[J]. 中小学电教(下半月) 2017(07)
    • [10].例谈“模式识别”在中考中的应用[J]. 中小学数学(初中版) 2008(03)
    • [11].基于正常人的肌电模式识别抗力变化的鲁棒性研究[J]. 中国康复医学杂志 2020(02)
    • [12].模式识别解题的理论探讨[J]. 数学通报 2010(03)
    • [13].模式识别在机器人技术中的应用[J]. 科技传播 2018(19)
    • [14].模式识别的概述及其应用[J]. 通讯世界 2018(08)
    • [15].距离模式识别图的判定[J]. 数学杂志 2017(06)
    • [16].模式识别:突破中考的快捷键[J]. 数学教学通讯 2010(25)
    • [17].从一种数学模型的探究谈模式识别的“立”与“破”[J]. 中学数学月刊 2012(05)
    • [18].利用“模式识别”巧解题[J]. 中学数学教学参考 2015(Z2)
    • [19].医学模式识别课程建设的探索[J]. 医学信息 2010(03)
    • [20].结合科研的“模式识别”研究生教学改革探索与实践[J]. 科技视界 2019(06)
    • [21].机载火控雷达工作模式识别[J]. 电子测量技术 2016(02)
    • [22].“模式识别新技术研讨课”教学探索思考[J]. 教育现代化 2018(45)
    • [23].高校模式识别课程改革与探讨[J]. 电脑知识与技术 2019(20)
    • [24].浅谈模式识别在图像识别中的应用[J]. 电子测试 2017(23)
    • [25].基于二次曲面拟合的图像颜色渐变模式识别[J]. 广东科技 2017(01)
    • [26].解题应多一些模式,少一些模式化[J]. 数学教学通讯 2013(36)
    • [27].基于数学问题解决的模式识别解题策略的探析与思考[J]. 中学数学研究 2014(10)
    • [28].2014年全国模式识别学术会议[J]. 智能系统学报 2014(01)
    • [29].2009年全国模式识别学术会议暨中日韩模式识别学术研讨会征文通知[J]. 模式识别与人工智能 2009(02)
    • [30].基于驾驶员意图及行驶场景判断的智能驾驶模式识别策略[J]. 汽车实用技术 2020(09)

    标签:;  ;  ;  ;  

    基于仿生模式识别的文本分类技术研究
    下载Doc文档

    猜你喜欢