论文摘要
缓存技术是提高数据访问性能的重要技术之一,在计算技术的多个领域得到了广泛的应用。通过分析用户对数据信息的访问特征,缓存技术巧妙地利用数据的可复制性和可共享性,在最佳地点将数据复制并保存下来供用户使用,减少了对网络带宽及高延迟设备的依赖,进而提高了数据的使用效率。语义缓存技术通过缓存查询的结果及其语义描述信息,发掘蕴藏在查询谓词中的语义信息来组织查询结果。相比传统缓存技术,能更有效地利用缓存,减轻服务器和网络的负担。因此,利用语义缓存技术提高系统响应能力,减少网络通信是本课题研究的主要目标。本文以支持数据并行处理的中间件系统为应用和研究的环境,阐述了缓存技术在中间件系统中应用的重要意义,提出了将语义缓存应用于中间件的基本思想,并重点研究了语义缓存在中间件系统中应用的关键技术。语义缓存的组织是语义缓存的重要基础。只有确定了如何组织缓存,才能实现对缓存的利用和管理。本文语义缓存的组织主要研究存储的内容和存储形式两个方面,研究并分析了语义缓存机制的基本思想,在此基础上设计并实现了缓存中的查询处理算法。由于本文的语义缓存系统的缓存粒度以及查询处理方法与传统的以页面或元组为粒度的缓存策略不同,因此提出了适合本系统的基于语义的替换策略。该替换策略根据对语义缓存组织的研究,结合语义缓存中查询处理的特点,从精确匹配、包含匹配和相交匹配三个方面进行研究与设计,由语义缓存描述项所在关系的访问频率以及在这些投影属性上满足缓存项条件的那些数据的访问情况共同决定缓存项的未来访问概率。在分析传统缓存一致性维护策略特点的基础上,针对数据并行处理中间件,考虑网络的连接状况,提出了适合本文的语义缓存机制的一致性维护策略。本文在实现缓存原型系统的基础上,对原型系统进行了验证实验和性能分析。测试结果表明,本文提出的语义缓存策略显著地改善了并行处理中间件查询性能