互联网中网页和它们之间的链接构成了一个庞大的有向图,称为网络图(Web Graph)。这个图包含了丰富的链接信息和有趣的性质,比如链接数目的幂法则分布,连通域等等。对Web Graph中链接信息的开发,对于Web信息资源的建设、利用和发展都有着重要的意义。中国Web Graph是属于整个互联网全体的一个重要子集,其中包含很多本地化的特征性质,这使得对应的性质和演化以及建模可能有一些的变化。本文通过对天网在2004年的大规模中文网页链接数据的分析,获取了中国Web Graph的静态性质;通过对一百五十个网站的监控,找出中国Web Graph的动态演化信息。最后,本文在以上两个研究结果的基础上,研究了层次化的Web Graph建模方法,并用之解释一些现有的现象。这些研究对于促进中国互联网的发展有十分重要的意义。通过对中国Web Graph中网页连接结构的研究,我们可以从不同方面获取中国Web Graph的各种统计特征和性质,并通过统计网页内容和Web Graph结构的变化了解中国Web上的演化情况。在特征性质方面,本文通过大量数据统计说明了中国Web Graph上入度出度的分布,网站大小,网站入度出度和连通块大小都是服从幂指数分布的。在链接结构方面,本文通过对连通分量的分析,得出了中国Web Graph和全局的异
本文来源: https://www.lw50.cn/article/005c6c5abd1d74400bd294b4.html