P2P流媒体识别方法的研究

P2P流媒体识别方法的研究

论文摘要

随着P2P技术应用的不断扩展,特别是文件共享和流媒体业务不断壮大,P2P网络本身潜在的安全问题和对各种资源,特别是带宽资源的滥用,已经受到各个网络运营商的高度重视。因此,实现分类、标识和控制P2P流量越来越成为企业、网络运营商急需解决的问题。目前,对P2P应用流量的识别与检测已形成了成熟产品的技术主要是基于深层数据包特征码匹配。任何基于程序性固定特征匹配的识别方法随着软件的更新或加密而极易失效,只有能体现应用流量本质的行为模式识别才是最终解决办法。但目前针对P2P流媒体流量行为特征的研究却几乎没有,而其应用软件的更新及流行速度却远较其它类型的P2P软件要迅速和广泛得多,从而使原本在P2P网络中就已出现的安全及盗版问题变得更加严重和难以控制。因此必须开展基于P2P流媒体流量行为特征模式的识别技术研究,以实现对未知应用和加密后流量的识别,这是具有非常重要理论意义和实用价值的研究。根据大量相关性研究结论和对P2P系统网络各种特征的分析,对P2P网络本质特征研究表明:P2P系统的网络区别于其它系统最本质的特征在于它的动态特性,并提出可将P2P网络的各种动态特征归纳为节点扰动和资源暂存两个方面的分类观点。从节点扰动性的角度研究适用于各类型P2P流量的识别算法CSI。由于发现P2P网络中节点扰动会引起随机访问节点时成功建立连接概率较低的现象。CSI算法通过计算一段时间间隔内单节点向外发出连接请求且连接成功的概率,并使用核密度估计方法对计算出的概率序列进行数值分布规律及时间变化趋势分析,然后根据分析结果对流量加以识别。由节点在线时间概率分布模型推导出网络中已有节点的继续存活时间的概率分布模型。由该模型,对集中式和DHT结构式两种典型架构的P2P网络任意节点访问成功概率的研究表明由于规模巨大和节点扰动,在这两种类型网络中都难以实现较高的成功率。此结论为CSI算法的建立提供了很好的理论证明。具体流量识别实验也证明CSI算法能很好的适用于各种类型的P2P流量。根据对P2P流媒体流量具有两层性特点(P2P特征+流媒体应用导致的新特征)的分析,提出一种对流媒体流量先进行P2P特征识别,再对识别出的P2P流量进行流媒体特征识别的层次识别模型。这种层次识别思路简化了识别算法的设计,且能大大减轻识别开销。P2P直播系统网络具有资源暂存性极大的特点,因此通过计算节点的平均BM信息比可有效的实现其流量的识别,算法IRI正是基于此方法提出的。流媒体传输和播放需要有严格的实时性、时序性以及连续性的特点使直播系统具有了高频度周期性的信息交换以及下载调度的机制,以此来实现节点间最大限度的资源共享。直播节点会通过频繁交换资源结构信息(Buffer Map)来克服资源快速过期引起的资源访问失败。由此提出P2P直播流量应具有BM信息包高频传输的特征并提出相应的测量模型。进一步通过对节点资源的存活时间建立概率分布模型,推导出可用于识别直播流量的阈值。实际实验的结果也证明了IRI算法具有漏判率很低,而误判率略高的特点,结合对流速大小和流波形平稳度的考量后可有效地消除误判。同样可从资源暂存性的角度对另一种P2P流媒体应用的流量—点播的识别算法展开研究。由于P2P点播系统中的资源暂存性和实时顺序播放的要求,导致其频繁周期性调度下载机制没有改变,由此一种通过测量节点的断点调度一致性来进行流量识别的算法BSI被提出。由于硬盘存储和CDN服务器的加入,点播系统的节点资源暂存性较直播系统有所改善,但仍为其重要特征之一。加上流媒体传输的实时连续性要求,直播系统中频繁周期性的调度下载机制并没有改变,但相对周期增大,因此针对直播流量的识别技术不再适合点播。而点播系统对高交互性操作的要求,使得周期内下载从直播的固定一次调度模式变为可多次随机调度的机动模式,系统以此提高下载的反应速度。而频繁周期性下载会造成数据流传输过程中的断流现象,对于流媒体系统,断流后数据的继续传输几乎都是由调度下载的行为引起的。而点播系统的灵活调度模式使得它的调度行为变得比直播系统中的要更为明显和易于测量(调度控制包的负载较大)。相应测量模型和阈值被提出,并通过最大熵方法对阈值的可用性进行证明。实验结果证明BSI算法不仅适用于点播流量,对直播流量也同样有良好的识别效率。

论文目录

  • 摘要
  • Abstract
  • 1 绪论
  • 1.1 研究背景
  • 1.2 国内外研究现状
  • 1.3 主要创新和研究内容
  • 1.4 论文结构
  • 2 P2P网络的动态特征分析与测量
  • 2.1 引言
  • 2.2 P2P网络动态特征分类和可用性测量
  • 2.3 动态特征测量
  • 2.4 本章小结
  • 3 基于节点扰动性的P2P流量识别方法
  • 3.1 引言
  • 3.2 节点访问成功率问题
  • 3.3 基于节点连接成功率的P2P流量识别算法: CSI
  • 3.4 实验分析
  • 3.5 本章小结
  • 4 基于资源暂存性的P2P直播流量识别方法
  • 4.1 引言
  • 4.2 多源 P2P直播系统特点
  • 4.3 多源型 P2P直播流量特征发现及测量
  • 4.4 P2P直播节点平均 BM信息比阑值推导
  • 4.5 基于 BM信息比的P2P直播流量识别算法: IRI
  • 4.6 实验结果与分析
  • 4.7 本章小节
  • 5 基于资源暂存性的 P2P点播流量识别方法
  • 5.1 引言
  • 5.2 多源 P2P点播系统特点变化
  • 5.3 多源型 P2P点播流量特征的发现及测量
  • 5.4 P2P点播流量断点调度一致性的阈值研究
  • 5.5 基于断点调度一致性的 P2P点播流量识别算法: BSI
  • 5.6 实验结果与分析
  • 5.7 本章小结
  • 6 全文总结
  • 6.1 全文总结
  • 6.2 今后的工作
  • 致谢
  • 参考文献
  • 附录 1 攻读学位期间发表论文目录
  • 附录 2 攻读学位期间参加研究的科研项目
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  ;  

    P2P流媒体识别方法的研究
    下载Doc文档

    猜你喜欢