论文摘要
对于以关系模式作为统一的数据模型的异构数据源信息、集成系统,若采用中间件体系结构,则集成XML数据源时通常需要解决两个问题:将XML转换为关系模式,以及将SQL查询语句转换为针对XML文档的查询语句。本研究基于前述问题提出,对半结构化XML数据源进行包装,主要实现以下两个功能。其一把基于XML Schema的XML模式转换为关系模式,隐藏了底层的数据细节。模式转化是本研究的重点,现有很多XML Schema到关系模式的映射算法实现了结构信息的转换,但语义约束信息考虑不够全面,只能处理较简单的schema描述。本文在对国内外研究现状进行综合分析的基础上,对XML Schema进行深入研究,提出了关系和约束的定义,根据这些定义设计结构映射规则和语义映射规则,解决schema正确映射为关系模式的问题。映射结果不仅保证了XML Schema结构信息的完整,还保留了大部分语义约束,并证明映射后得到的关系模式满足BCNF。其二把SQL查询语句转换为XQuery查询语句,以便对XML文档数据进行快速准确的查询,并以XML格式返回查询结果。整个过程无需将XML数据转存至关系数据库中,而只进行模式映射备份,使用户访问XML数据如同访问关系数据库一样,从而实现了对XML数据的透明操作。