三网融合下广电文本信息的分类技术研究

论文摘要

三网融合已逐渐成为我们信息技术发展的大趋势。在三网融合的大背景下，信息的传播途径将更加丰富、传播时间将更短、覆盖面将更大。由此会带来一系列的问题：大量的色情、暴力、血腥、反动、迷信的信息会得到更广泛、快速的传播，产生更大的危害；知识产权难以得到保护；垃圾信息充斥网络。因此需要一个强有力的内容监管系统对整个网络进行监管，屏蔽不良信息，过滤垃圾信息，打击盗版，净化网络环境，为全网内容可管、可控提供保障。随着网络文字媒体的不断涌现翻新，在三网融合的大前提下，文本信息监管愈发显的重要。文字内容监管系统是内容监管系统下的一个子系统，承担着对网络中一切文字信息的监管责任。文字监管系统通过对网络中的文字信息内容进行分析，对文本进行自动分类，自动识别，自动处理。面对海量的文字信息，要高效的进行处理，需要进行文本分类。运用文本分类方法能够屏蔽不良信息、过滤垃圾信息、保护知识产权。文本分类的效率会直接影响到文字内容监管系统的工作效率，因此，改进文本分类的算法是研究的重点。特征权重计算和分类模型是影响文本分类的关键因素。改进特征权重算法，使得更能表征文本类别的特征项获得更高的权重值；改进分类模型，使得分类的时间开销大幅降低。通过实验验证，改进后的方法准确度更高，速度更快，更加适合文字内容监管系统。

论文目录

摘要

Abstract

1 绪论

1.1 广电内容监管的研究背景

1.2 广电内容监管研究的目的和意义

1.3 国内外研究概况

1.4 本文的研究工作及章节安排

2 系统 HUSTRIM 的总体设计

2.1 HUSTRIM 系统目标

2.2 HUSTRIM 系统功能

2.3 HUSTRIM 系统结构

2.4 HUSTRIM 系统设计

2.5 文字监管子系统

2.6 本章小结

3 文字监管系统的权重算法和分类算法

3.1 概述

3.2 TF-IDF 算法

3.3 分类算法关键技术分析

3.4 本章小结

4 HUSTRIM 文字监管子系统的设计与实现

4.1 系统描述

4.2 系统主要功能

4.3 系统结构

4.4 实现策略

4.5 系统实验说明

4.6 本章小结

5 文字监管子系统的实验及其结果分析

5.1 系统介绍

5.2 实验环境

5.3 实验语料

5.4 实验设计及结果分析

5.5 本章小结

6 总结与展望

6.1 全文总结

6.2 展望

致谢

参考文献

三网融合下广电文本信息的分类技术研究

论文摘要

论文目录

相关论文文献

猜你喜欢