三网融合下广电文本信息的分类技术研究

三网融合下广电文本信息的分类技术研究

论文摘要

三网融合已逐渐成为我们信息技术发展的大趋势。在三网融合的大背景下,信息的传播途径将更加丰富、传播时间将更短、覆盖面将更大。由此会带来一系列的问题:大量的色情、暴力、血腥、反动、迷信的信息会得到更广泛、快速的传播,产生更大的危害;知识产权难以得到保护;垃圾信息充斥网络。因此需要一个强有力的内容监管系统对整个网络进行监管,屏蔽不良信息,过滤垃圾信息,打击盗版,净化网络环境,为全网内容可管、可控提供保障。随着网络文字媒体的不断涌现翻新,在三网融合的大前提下,文本信息监管愈发显的重要。文字内容监管系统是内容监管系统下的一个子系统,承担着对网络中一切文字信息的监管责任。文字监管系统通过对网络中的文字信息内容进行分析,对文本进行自动分类,自动识别,自动处理。面对海量的文字信息,要高效的进行处理,需要进行文本分类。运用文本分类方法能够屏蔽不良信息、过滤垃圾信息、保护知识产权。文本分类的效率会直接影响到文字内容监管系统的工作效率,因此,改进文本分类的算法是研究的重点。特征权重计算和分类模型是影响文本分类的关键因素。改进特征权重算法,使得更能表征文本类别的特征项获得更高的权重值;改进分类模型,使得分类的时间开销大幅降低。通过实验验证,改进后的方法准确度更高,速度更快,更加适合文字内容监管系统。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 广电内容监管的研究背景
  • 1.2 广电内容监管研究的目的和意义
  • 1.3 国内外研究概况
  • 1.4 本文的研究工作及章节安排
  • 2 系统 HUSTRIM 的总体设计
  • 2.1 HUSTRIM 系统目标
  • 2.2 HUSTRIM 系统功能
  • 2.3 HUSTRIM 系统结构
  • 2.4 HUSTRIM 系统设计
  • 2.5 文字监管子系统
  • 2.6 本章小结
  • 3 文字监管系统的权重算法和分类算法
  • 3.1 概述
  • 3.2 TF-IDF 算法
  • 3.3 分类算法关键技术分析
  • 3.4 本章小结
  • 4 HUSTRIM 文字监管子系统的设计与实现
  • 4.1 系统描述
  • 4.2 系统主要功能
  • 4.3 系统结构
  • 4.4 实现策略
  • 4.5 系统实验说明
  • 4.6 本章小结
  • 5 文字监管子系统的实验及其结果分析
  • 5.1 系统介绍
  • 5.2 实验环境
  • 5.3 实验语料
  • 5.4 实验设计及结果分析
  • 5.5 本章小结
  • 6 总结与展望
  • 6.1 全文总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 相关论文文献

    标签:;  ;  ;  

    三网融合下广电文本信息的分类技术研究
    下载Doc文档

    猜你喜欢