论文摘要
计算机群集是一种把多台计算机组织起来,通过统一的资源整合与任务调度,模拟成一台功能更为强大的机器,通过分布式计算来协同完成各种任务的技术。随着计算机硬件性能的提高,群集技术的高可用性和扩展性为实现容错冗余和执行高性能计算提供了可靠的硬件平台。随着网络技术的发展,尤其是网格计算的提出,人们对高性能计算的要求不断提高,传统群集在地理位置上集中的要求成为瓶颈,影响了群集的扩展。另一方面,传统群集节点间缺乏有效的中间结果数据交互手段,限制了群集整体计算效率的提高。本论文介绍了计算机群集和共享文件搜索策略的发展和国内外研究现状,详细地阐述了目录服务与虚拟机技术的技术特征和作为实验支撑技术的优势,以及具有代表性的Cache搜索策略的优点与原理,通过分析计算机群集的基本构架和相关技术提出计算机群集的局限性,建立了一种能跨越局域网的群集模型,并结合虚拟机技术实现广域网群集,然后分析和论述广域网群集与Cache搜索策略的结合点,提出了一种基于搜索代理的广域网群集共享文件搜索策略,以实现群集节点间的中间结果数据交互。本文最后将进行实验测试,通过测试结果的对比来验证相关模型和策略的可行性。