基于改进的SVM-KNN算法的中文网页层次式分类

基于改进的SVM-KNN算法的中文网页层次式分类

论文摘要

随着互联网进入Web2.0时代,Blog、SNS等新兴网络媒体日益流行起来,Web信息量出现爆炸性增长。面对Web上的海量数据,人们要想有效地获取自己所需要的信息已变得越来越困难。如何对Web中各种资源进行有效地组织和管理,帮助用户快速有效地查找到真正所需要的信息就成为一个非常有意义的课题。本文针对中文网页的层次式分类进行研究。首先本文对使用的相关技术进行了概述,其中包括SVM算法和层次式文本分类的基本理论。然后本文对SVM-KNN算法进行分析,针对其在样本分布不平衡时存在的不足之处,本文对SVM-KNN算法进行了一点改进。在此基础上,本文提出了一个层次式文本分类模型,然后将此模型应用到中文网页分类这一实际问题中,设计并实现了一个原型系统。最后,我们利用CCT2002语料库对本文提出的层次式分类模型、层次式SVM算法及平面式SVM算法这三种文本分类方法进行了对比实验。实验结果表明本文提出的基于改进SVM-KNN算法的文本分类方法在不仅保持了一定的分类精确度,而且有效地减少了文本分类所耗费的时间。因此我们认为这种方法是比较适合于应用到中文网页分类这一实际问题中去的。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 国内外研究现状
  • 1.3 本文研究工作和内容组织
  • 1.3.1 本文研究工作
  • 1.3.2 本文内容组织
  • 1.4 本章小结
  • 第2章 相关技术综述
  • 2.1 SVM理论
  • 2.1.1 SVM概述
  • 2.1.2 SVM的形式化描述
  • 2.1.3 SVM的多类别分类
  • 2.2 层次式文本分类
  • 2.2.1 文本分类的定义
  • 2.2.2 层次式文本分类的定义
  • 2.2.3 两种类别体系结构
  • 2.2.4 两种主要方法
  • 2.3 本章小结
  • 第3章 基于改进的SVM-KNN算法的层次式文本分类
  • 3.1 SVM-KNN算法及改进
  • 3.1.1 算法提出的背景
  • 3.1.2 算法的实现
  • 3.1.3 算法的改进
  • 3.1.4 实验与分析
  • 3.2 基于改进的SVM-KNN算法的层次式文本分类模型
  • 3.2.1 模型的总体结构
  • 3.2.2 模型的训练阶段
  • 3.2.3 模型的分类阶段
  • 3.2.4 时间复杂度分析
  • 3.3 本章小结
  • 第4章 原型系统的设计与实现
  • 4.1 系统的总体架构
  • 4.2 系统的功能模块
  • 4.2.1 页面预处理模块
  • 4.2.2 层次式文本分类器模块
  • 4.3 实验与分析
  • 4.3.1 实验准备
  • 4.3.2 数据预处理
  • 4.3.3 分类质量评价指标
  • 4.3.4 实验结果与分析
  • 4.4 本章小结
  • 第5章 总结与展望
  • 5.1 本文的主要工作
  • 5.2 展望
  • 参考文献
  • 攻读硕士学位期间主要的研究成果
  • 致谢
  • 相关论文文献

    • [1].高校辅导员与大学生心理的层次式交流[J]. 湘南学院学报 2009(06)
    • [2].食品营养学双语层次式教学的应用探讨[J]. 安徽农学通报 2015(24)
    • [3].线长驱动的层次式FPGA布局算法[J]. 微电子学 2009(03)
    • [4].麒麟操作系统层次式内核设计技术[J]. 国防科技大学学报 2009(02)
    • [5].新课改下构建英语“层次式”作业的思考[J]. 学园(教育科研) 2013(02)
    • [6].一种层次式远程数据持有检测方法[J]. 计算机科学 2017(03)
    • [7].“单片机原理”课程层次式教学改革研究[J]. 计算机教育 2008(18)
    • [8].层次式数据库访问信道的多模融合算法实现[J]. 科技通报 2015(08)
    • [9].代码分析中的层次式静态检测方法[J]. 计算机与现代化 2013(09)
    • [10].层次式软件体系结构抽象模型研究[J]. 福建电脑 2011(03)
    • [11].层次式教学提升高中生物理学习能力探讨[J]. 理科考试研究 2014(17)
    • [12].基于层次式软件体系结构的教师继续教育管理系统的设计与实现[J]. 常州工学院学报 2012(02)
    • [13].基于最近服务的层次式网格信任模型[J]. 南京航空航天大学学报 2011(02)
    • [14].域外传真[J]. 城市管理与科技 2014(04)
    • [15].基于CIMS的移动通信网管层次式解决方案[J]. 沈阳农业大学学报 2011(05)
    • [16].基于Ajax技术的层次式模糊查询系统设计与实现[J]. 重庆理工大学学报(自然科学版) 2010(09)
    • [17].基于VPR的层次式FPGA结构描述方法研究[J]. 微电子学 2009(01)
    • [18].层次式交换机设计与实现[J]. 微电子学与计算机 2014(03)
    • [19].基于无标记Web数据的层次式文本分类[J]. 智能系统学报 2014(03)
    • [20].基于过程约束信息的层次式软件体系结构设计[J]. 自动化与仪器仪表 2019(02)
    • [21].无线传感器网络中基于层次式标记的溯源追踪方法[J]. 电子技术与软件工程 2019(03)
    • [22].动态层次式接入控制方法的研究[J]. 无线通信技术 2012(02)
    • [23].层次式策略在初中英语教学中运用[J]. 文理导航(下旬) 2013(12)
    • [24].层次式无线传感器网络中的协商机制研究[J]. 计算机技术与发展 2008(03)
    • [25].层次式FPGA快速布局算法[J]. 计算机辅助设计与图形学学报 2010(09)
    • [26].基于层次式匹配的最佳路径匹配算法[J]. 现代职业教育 2016(07)
    • [27].层次式体系结构下一种似然时标系统[J]. 计算机学报 2008(03)
    • [28].μC/OS的层次式状态机在人机界面中的应用[J]. 杭州电子科技大学学报 2010(05)
    • [29].基于层次式创新实践模式的本科生科研训练[J]. 教育教学论坛 2015(44)
    • [30].一种可信安全的层次式基于身份加密系统[J]. 电子学报 2016(07)

    标签:;  ;  ;  ;  

    基于改进的SVM-KNN算法的中文网页层次式分类
    下载Doc文档

    猜你喜欢