面向P2P的Markov模型

面向P2P的Markov模型

论文摘要

随着网络和信息技术的发展,基于计算机网络的各种应用和创新不断出现。在当前网络技术研究和应用中,P2P(Peer-to-Peer)和IPTV(Intemet Protocol Television)都是人们关注和研究的热点。由于节点或用户的频繁进出,这两类系统都具有极大的随机性。而且在大规模应用中,这些系统在网络中的覆盖面往往极为广泛,并且和其它大量服务集成在一起,表现出分布式分层的结构特征,确定其性能的主要因素往往很复杂,并且各种因素相互制约。应用系统的性能瓶颈问题和优化问题成为研究、设计和实现这些系统的关键问题,其中有些可以直接通过技术改造和升级来解决,但需要大量人力物力。从系统理论的观点来看,其中一些问题也是可以在现有环境下通过现代优化和控制的理论和方法来解决的,特别是,还可以利用基于Markov过程的模型,以避开具有复杂物理背景的精确数学模型的构造与辨识。考虑一类具有分层结构的非结构化P2P系统的层级构成和“组划分”问题。这类系统按照某种原则分成一个个由若干节点构成的组,并在每个组中选出一个超级节点来索引本组内的节点和资源,普通节点的查询通过超级节点的组内查询和组间查询完成。这类系统实际将网络分成了两层,第一层是组内系统,以超级节点为中心;第二层是以超级节点为代表的组间系统,采用纯分布式P2P方式和使用泛洪式搜索。由于系统规模和节点分布是随时间动态变化的,组的划分需要进行适应,以保汪最优的系统总体性能。本文将这类系统的“组划分”及其切换行为进行抽象,利用Markov切换空间模型进行描述:每一个组划分下的状态过程对应于一个状态空间,其动态性可以用Markov过程描述;而组划分切换的控制对应于Markov切换空间模型的行动,根据给定的策略进行选取。可以证明Markov切换空间模型等价为Markov决策过程或参数化Markov报酬过程,在此基础上,利用策略迭代和梯度方法求解最优策略并通过仿真验证所获结果的正确性。在实际工程中的一种具有P2P特征的分布式VoD(Video on Demand)系统,采用了全局中心化的目录服务器对存储到网络边缘服务节点上分段缓存的数据进行索引和定位。针对这种中心化资源定位服务存在的问题,使用将随机漫步和中心目录服务器结合的混合搜索方法提高系统的扩展性和降低目录服务器或网路单点失效问题的影响。在此基础上,利用基于Markov过程的模型来描述和讨论采用这种方法的资源定位服务。为了应对大状态空间的问题,保证状态空间不会进一步扩大,本文利用基于事件的方法进行建模,并根据状态的不同性质进行状态聚集,以降低问题的复杂程度。还利用简化的一次定位模型,讨论了混合方法的搜索效率和代价的控制问题。考虑到实际中接入控制和定位服务是息息相关的,本文将接入控制引入资源定位服务模型,和定位服务结合在一起进行了讨论。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 IPTV概述
  • 1.2 P2P概述
  • 1.3 通信网络中的性能优化方法
  • 1.4 本文的主要研究目的和主要内容
  • 1.5 本文的主要贡献
  • 第二章 IPTV和P2P相关技术
  • 2.1 IPTV相关技术
  • 2.1.1 IPTV业务分类
  • 2.1.2 IPTV系统构架
  • 2.1.3 流媒体技术
  • 2.1.4 内容分发网络
  • 2.1.5 其它
  • 2.2 P2P相关技术
  • 2.2.1 P2P分类和应用
  • 2.2.2 资源定位
  • 2.2.3 P2P技术在IPTV中的应用
  • 2.3 应用
  • 2.3.1 CNGI视频多媒体点播系统
  • 2.3.2 3Tnet
  • 第三章 Markov决策过程简介
  • 3.1 基本概念
  • 3.1.1 决策时刻
  • 3.1.2 状态和行动
  • 3.1.3 报酬和转移概率
  • 3.1.4 行动选择和策略
  • 3.1.5 转移概率矩阵、无穷小矩阵和优化准则
  • 3.2 性能差、性能导数公式和最优方程
  • 3.2.1 实现因子和性能势
  • 3.2.2 性能势的估计
  • 3.2.3 性能差与性能导数公式
  • 3.2.4 Markov决策过程的最优性方程
  • 3.3 基本性能优化算法
  • 3.3.1 策略迭代算法
  • 3.3.2 性能梯度与基于梯度的优化
  • 第四章 一类分层非结构化P2P系统的动态组划分切换模型
  • 4.1 Markov切换空间过程
  • 4.2 动态组划分切换模型
  • 4.2.1 动态组划分切换行为
  • 4.2.2 系统模型
  • 4.2.3 优化算法
  • 4.2.4 实验和结果
  • 第五章 一类基于P2P的分布式VoD系统模型
  • 5.1 系统模型
  • 5.1.1 资源定位
  • 5.1.2 接入控制
  • 5.1.3 系统的数学描述
  • 5.2 纯资源定位模型
  • 5.2.1 离散时间Markov决策过程模型
  • 5.2.2 基于事件的策略迭代
  • 5.2.3 状态聚集
  • 5.2.4 实验和结果
  • 5.3 一次资源定位过程模型
  • 5.3.1 具有吸收态的Markov链模型
  • 5.3.2 参数选择
  • 5.3.3 实验和结果
  • 5.4 具有访问控制的模型
  • 5.4.1 Markov决策过程模型
  • 5.4.2 参数化梯度算法
  • 5.4.3 实验和结果
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 参考文献
  • 致谢
  • 在读期间的主要工作
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    面向P2P的Markov模型
    下载Doc文档

    猜你喜欢