论文摘要
垃圾短信泛滥是近年来困扰运营商和普通用户的一个重大问题。本文针对垃圾短信过滤中的垃圾短信判别问题,利用机器学习领域中的Bayes分类方法、SVM分类方法和社会网络方法,结合短信发送过程中的具体限制性条件,对垃圾短信内容识别和垃圾短信发送用户的识别这两个问题中的关键技术进行了深入的研究。完成的主要工作包括:1、统一垃圾短信过滤模型本文中提出了一个可以解决多种短信发送方式的过滤模型——统一垃圾短信过滤模型。该模型即考虑到了不同发送端短信的具体特征,又尽可能利用现有的针对短信和短信发送用户的短信阻止机制,能够有效地过滤各种类型的垃圾短信,减少改造成本。2、基于多特征的垃圾短信识别算法设计了一种基于多特征的垃圾短信识别算法,综合考虑短信发送的行为特征、短信的文本分词后特征,利用Bayes分类和SVM分类方法分别离线与在线的实现对垃圾短信内容的学习和实时分类;并通过一组基于反馈的自学习机制,使分类器具备增量式学习能力。实验和分析表明:本文的算法相比传统方法在过滤效率和准确率两方面均获得大幅度提升。3、基于社会网络的垃圾短信发送用户识别从社会网络的角度对短信发送问题进行形式化的建模,通过实验验证了短信发送网络所具有的社会性特征,如小世界原理、幂率等,并在此基础上进一步分析和挖掘了垃圾短信用户在网络上发送接收的异常模式和行为,并以此提出了一个基于语音关联程度和短信回复比率的过滤算法(NASFA算法)。实验和分析表明:算法不仅能够高效的识别垃圾短信发送号码,同时能够有效的控制将正常用户误识别为垃圾短信用户的比率。4、基于位置特征的垃圾短信发送用户识别对于垃圾短信发送者而言,其在地理位置上具有明显的特征。据此提出了一个利用位置特征和短信发送内容的垃圾短信发送用户识别算法。5、面向网络端发送短信的快速匹配过滤算法针对网络端发送的短信具有发送速度快、发送频率变化范围大、不具备社会性特征和分类特征过少等特点,本文提出了一种适用于网络端口发送类垃圾短信的监控和过滤解决方案,通过编码预处理算法来克服反过滤干扰手段,并根据短信日发送数量、短信内容等特征,采用模糊匹配和频度监控相结合的方法动态进行短信过滤。此外,还引入了关键字加权控制频度方法,根据短信长度修正过滤的阀值。最后对全文进行概括性总结,并指出了下一步重点需要研究和突破的方向。
论文目录
相关论文文献
- [1].基于云计算及贝叶斯算法的垃圾短信过滤技术研究与实现[J]. 金陵科技学院学报 2013(03)
- [2].基于关联规则的垃圾短信分类器模型[J]. 南通大学学报(自然科学版) 2014(03)
- [3].设计科学视角的垃圾短信过滤算法研究[J]. 计算机工程与应用 2016(19)
- [4].基于朴素贝叶斯和支持向量机的短信智能分析系统设计[J]. 重庆理工大学学报(自然科学版) 2010(01)
- [5].基于复杂网络的垃圾短信过滤算法[J]. 自动化学报 2009(07)
- [6].基于朴素贝叶斯和支持向量机的自适应垃圾短信过滤系统[J]. 计算机应用 2008(03)
- [7].一种高效垃圾短信过滤系统的实现[J]. 电信科学 2008(05)
- [8].一个大规模垃圾短信实时过滤系统[J]. 北京邮电大学学报 2008(03)
- [9].基于社交网络机理的短信息监控系统[J]. 电信科学 2011(10)
- [10].云计算技术在垃圾短信过滤中的应用与实现[J]. 信息网络安全 2015(07)