基于物流车队应用SVM文本挖掘研究

基于物流车队应用SVM文本挖掘研究

论文摘要

随着计算机技术和系统工程学的飞速发展,在全球信息化大潮的推动下,数据挖掘已成为研究中活跃份子之一,从数据中发现有价值的知识模式已成为具有重要意义的研究领域。支持向量机是一种新型机器学习方法,它较好地解决了非线性、高维数等问题,已经应用在许多领域,如手写数字识别、对象识别、文本分类等。但是新的方法也存在问题需要解决,如文本分类具有类别和样本数目多、噪音多、各类别样本数目不均衡等特点,使得支持向量机用于文本分类时存在训练速度和分类速度较慢的缺点。为了解决实体物流公司车队车辆使用情况不易监控,保养维护不能及时到位等问题,本文针对物流公司车队行车记录进行文本挖掘,监控每一次运输任务对车辆使用强度,利用信息技术对车辆保养维修做到精细化管理。行车记录挖掘基于中文分词处理技术,利用TF×IDF方法将特征项进行加权,并用向量空间方法将行车记录文本表达为数学方式经行后续挖掘计算。在特征项降维处理中,通过实验对信息增益、交叉熵、互信息和χ2统计四种降维方法进行比较,观察出信息增益和互信息最合适行车记录特点,最终作为降维方法。行车记录分类采用支持向量机算法。标准支持向量机只能用于单标号样本分类,本文针对多类分类问题,提出了树形结构构建多类支持向量机分类器。为了优化分类器效率,提出使用聚类算法思想,构造平衡二叉树结构,以提高分类器分类速度。还对常用的h次多项式核函数,高斯径向基核函数和S型核函数三种核函数经行实验,找出准确性较高的核函数。在系统设计上,各个模块采用低耦合方式设计,便于监视文本挖掘过程中各个环节的输出值,并提高系统灵活性,使各个模块便于维护和修改。

论文目录

  • 内容摘要
  • Abstract
  • 第1章 引言
  • 1.1 研究背景
  • 1.2 本文内容安排
  • 1.3 研究方法
  • 第2章 文献综述
  • 2.1 国外研究现状
  • 2.2 国内研究现状
  • 第3章 中文文本分类技术
  • 3.1 本文分类概述
  • 3.2 文本预处理及中文分词
  • 3.3 向量空间模型表示文本
  • 3.4 文本分类算法
  • 3.5 分类器性能评估
  • 第4章 基于SVM文本分类的研究
  • 4.1 SVM概述
  • 4.2 线性可分的SVM
  • 4.3 非线性可分的SVM
  • 4.4 SVM训练算法
  • 第5章 基于支持向量机的多类分类研究
  • 5.1 多类SVM研究现状
  • 5.2 一种改进的多类SVM
  • 5.3 基于聚类算法改进的二叉树SVM
  • 第6章 系统建模和设计
  • 6.1 系统背景及目的
  • 6.2 系统模型设计及改进
  • 6.3 系统结构
  • 6.4 分词模块研究与设计
  • 6.5 文本表示模块研究与设计
  • 6.6 SVM训练模块研究与设计
  • 第7章 实验分析
  • 7.1 实验环境及评价指标
  • 7.2 降维算法实验
  • 7.3 支持向量机核函数实验
  • 第8章 总结与展望
  • 8.1 总结
  • 8.2 研究工作展望
  • 参考文献
  • 后记
  • 相关论文文献

    • [1].基于文本挖掘的电商评论情感分析[J]. 产业与科技论坛 2020(02)
    • [2].智能时代的教育文本挖掘模型与应用[J]. 现代远程教育研究 2020(05)
    • [3].文本挖掘领域研究现状与趋势分析[J]. 武汉船舶职业技术学院学报 2018(02)
    • [4].文本挖掘在药物靶位研究中的应用[J]. 中华医学图书情报杂志 2017(03)
    • [5].文本挖掘重点技术研究[J]. 漯河职业技术学院学报 2015(05)
    • [6].让标点符号教学“厚实”起来[J]. 福建基础教育研究 2016(12)
    • [7].基于文本挖掘的商学院数字创新课程研究[J]. 当代教研论丛 2017(04)
    • [8].文本特征提取研究现状分析与展望[J]. 科技创新与品牌 2017(04)
    • [9].基于文本挖掘的不同层次大学生英语作文的词汇和主题特征分析[J]. 英语研究 2017(01)
    • [10].基于文本挖掘的电子商务市场表现研究[J]. 科学中国人 2017(12)
    • [11].文本图表示模型及其在文本挖掘中的应用[J]. 情报学报 2013(12)
    • [12].基于文本挖掘的5G技术研究热点分析[J]. 科技管理研究 2020(19)
    • [13].基于文本挖掘的社会资本与大学生就业质量的关联性研究[J]. 社会保障研究 2018(04)
    • [14].基于疾病数据库的文本挖掘工具对比研究[J]. 中华医学图书情报杂志 2018(06)
    • [15].基于云计算的海量文本挖掘关键技术研究[J]. 信息与电脑(理论版) 2014(16)
    • [16].基于文本挖掘的国外移动图书馆研究热点分析[J]. 内蒙古科技与经济 2018(19)
    • [17].基于聚类分析的国内文本挖掘热点与趋势研究[J]. 情报学报 2019(06)
    • [18].谈小学语文教学“文本挖掘”的几个层面——从人教版小学语文第十册《草原》说起[J]. 中国农村教育 2019(24)
    • [19].基于文本挖掘的论坛热点问题时变分析[J]. 软件 2017(04)
    • [20].文本挖掘口角升温[J]. 世界科学 2013(05)
    • [21].基于文本挖掘法的北京市家庭医生评价体系构建及实证研究[J]. 中国全科医学 2020(25)
    • [22].基于文本挖掘和复杂网络的中美电商专利比较研究[J]. 情报杂志 2019(06)
    • [23].大数据环境下的文本挖掘教学内容探讨[J]. 无线互联科技 2018(09)
    • [24].主题模型在临床文本挖掘中的应用现状[J]. 医学信息学杂志 2018(05)
    • [25].自动术语识别——对科技文献进行文本挖掘的重要技术方法[J]. 现代图书情报技术 2008(08)
    • [26].语义文本挖掘算法优化研究[J]. 山东工业技术 2018(07)
    • [27].基于文本挖掘的形态分析方法的关键问题[J]. 图书情报工作 2012(04)
    • [28].基于专利文本挖掘的科技文化产业技术发展趋势研究[J]. 科技进步与对策 2019(23)
    • [29].中文文本挖掘的流程与工具分析[J]. 科技创新导报 2019(19)
    • [30].在线评论文本挖掘对电商的影响研究[J]. 中国商论 2018(33)

    标签:;  ;  ;  ;  

    基于物流车队应用SVM文本挖掘研究
    下载Doc文档

    猜你喜欢