论文摘要
在Internet飞速发展的今天,互联网已成为人们生活中的重要工具,它不仅用于信息的传播,还成为商业活动的重要媒介,被人们成为第四大媒体。然而随着互联网的流行,人们开始抱怨网络的速度慢,如何解决网络的速度问题成为Internet研究中的重要课题之一。在现代互联网的应用中,动态网页形式在很多网络应用中取代静态网页,已经成为网页形式的主流。动态网页应用包括如电子商务,网上拍卖,搜索引擎等,这些应用必然涉及到大量的数据库查询,带来大量的网络延迟和服务器端的开销,严重影响了Web服务器的性能。因此,减少数据访问延迟和改善网络性能的动态网页加速技术是目前解决网络速度的一个重要解决方案。本课题是在国家863“开源社区”项目背景下展开的,该项目致力于围绕分布式协同开发平台,构建一个Web2.0式的个性化服务平台——基于Web并集成了丰富的Web2.0元素(Wiki,Blog)和代码管理工具(SVN),拥有强大的Bug管理功能。为了给开发者提供一个良好的代码阅读环境,需集成一个强大的代码阅读系统LXR。传统的LXR系统利用Perl脚本动态生成,存在动态网页中的服务器性能低的问题。本课题就LXR性能低的问题展开了研究,提出了面向LXR的动态网页加速技术,构建了面向LXR的动态网页加速系统,克服了传统静态化方法的不足。系统主要有两个创新:一是提出了一种新的Web页面替换策略——FAS算法,该算法是针对服务器端,并考虑了网页的访问频率、网页的年龄以及网页的大小这三个LXR页面的访问特性而提出的,实验结果表明,该算法具有较好的性能;另一个是结合了LXR的页面特征,实现了一种基于概率预测模型的预取,基于Markov模型,根据历史访问的页面转移概率挖掘用户潜在的访问序列,实验结果表明,该预测算法具有可用性好、实现简单、命中率高等特点。本文首先介绍面向LXR的动态网页加速技术原理和加速系统的体系结构;其次分析并设计了系统的模块,着重介绍了页面替换模块的实现,详细地描述了算法的实现过程;接着介绍了基于概率预测模型的预取模块的实现;然后在LXR中实现了动态网页加速技术,并对系统性能进行了详细评测,测试数据表明该技术很大程度上提高了服务器的性能;最后进行了总结和展望。