论文摘要
P2P是一个开放、动态的计算环境,节点的自治性和网络的无中心性使得传统的安全机制难以保障系统的可靠运行。针对P2P特性建立信任机制是保障其安全的有效方法,但现有的信任研究大多集中于信任评估和信任管理研究,而对于如何改善信任环境,提高整个网络的系统效率研究不足。本文在分析前人对信任环境研究成果的基础上,针对现有模型的不足,分别对单次交易行为、多次交易行为和群体交易行为进行了策略分析,从单个节点的效率研究入手,通过影响节点的效率达到促进节点行为策略改变的目的,从而提高整个系统的信任水平。本文的主要工作包括:(1)对P2P网络中两个节点间的单次交易行为进行了研究,建立了P2P节点单次交易模型,找出了节点单次交易的最优策略。单次交易行为在系统中的特例是初次交易,大多数激励模型并没有考虑初次交易这一特殊情况,本文根据单次交易容易出现背叛的情况,设计了相应的行为策略,有效防止了背叛行为的发生。(2)对P2P网络中两个节点间的多次交易行为进行了研究,分别建立了有限次节点交易模型和无限次节点交易模型,并试图寻找一种策略使得节点在多次交易中所得的单体收益值最大化。通过对所选取策略的性能分析,模型所选取的策略在与多种策略的交互中表现出了良好的性能,具有一定的适用性。(3)对P2P网络中节点群体间的交易行为进行了研究,建立了基于强化学习的群体信任模型。通过前面两个模型的分析发现,个体的最优并不代表系统整体的最优,有时个体最优反而是群体最差的一种状态。因此,本文考虑建立一种基于群体的信任模型,通过改变其中的某些因素,使得个体在追求自身利益最大化的同时系统整体收益能够最大化,在无形中改善整个系统的信任环境。这样,整个信任环境就会朝着良性的方向发展,即网络中的节点选择信任策略的概率增加,从而达到改善网络信任环境的目的。对于P2P系统中个体行为策略的研究,本文从单次到多次,从个体到群体,逐步研究了节点的最佳收益策略,从节点自身策略和整个群体的收益两个方面对节点个体收益和系统整体收益进行了寻优过程。