论文摘要
随着互联网技术的迅速发展和普及,网络的应用规模在不断的扩大,互联网中信息急剧膨胀,传统的客户端/服务器工作模式(C/S模式)已经不再适应网络的发展,Peer-to-Peer(P2P)技术随之登上历史舞台。P2P技术以其能够提高网络工作效率、可扩展性好、容错性强等优点成为当今科学研究和产品开发的热点。资源共享是P2P最重要的应用,深入研究P2P网络的搜索机制具有极其重要的意义。非结构化P2P网络模型的搜索机制一般采用洪泛法,这种机制的缺点是会在网络上产生大量冗余信息。而结构化P2P网络模型是采用纯分布式的消息传递机制,提供根据关键字进行查找的定位服务,目前最新的研究成果大都是基于DHT(Distributed Hash Table)的分布式路由查找算法,它具有扩展性好、路有效率高、自适应强等特点。但是它是基于单关键词精确搜索的,且不支持语义。而很多情况下,人们并不能准确描述所要搜索的目标,给出描述同一目标的关键词也可能找不到满意结果。因此,本文提出一种基于用户行为的结构化P2P网络搜索机制,用户行为分析能够根据用户的搜索和下载行为发现关键字和资源的关系,本文在此基础上引入社区发现方法,目的在于挖掘关键字与资源间深层的关系,提高查全率与查准率,并实现资源按热门程度排序,将热门资源呈现给用户。本文的研究工作主要包括以下几个方面:第一,分析研究了几种P2P网络模型,以及各种模型所采取的资源搜索方法,并对它们的性能进了详细的对比分析,指出了它们各自存在的优缺点。第二,分析研究了用户行为分析方法,根据用户操作序列,按照一定的算法得出关键字与资源的相关关系,及其相关度。第三,研究了社区发现的相关理论,将社区发现方法引入到用户行为分析结果中,目的在于挖掘关键字与资源的深层关系。重点研究了两种社区发现方法,一种是关键字与资源构成的二部图的社区结构发现,一种是资源关系网的社区结构发现。在关键字与资源深层关系挖掘的基础上提出一种资源搜索算法,将资源按热门程度从大到小排序呈现给用户。第四,为了验证本文提出的搜索机制的可行性和有效性,本文用matlab软件进行仿真实验,实验结果表明本文提出的基于用户行为的资源搜索机制简单、可行,该机制是对原有DHT结构化网络的扩展而不是取代,因而适用性较广,并且还能随着用户的使用自适应改变自身性能。在提高查全率和查准率方面较传统基于DHT的结构化网络模型有了一定的改进。