论文摘要
在关系数据库中,无环数据库模式设计是数据库理论与图论相结合而产生的一个新的研究领域。无环数据库有许多优良特性,无环成为判断数据库模式优劣的又一重要标准。这里的环指的是在关系数据库中由于某些属性存在二义性,使得在查询这些属性的时候存在两条或两条以上的路径,这就形成了环。同样的,在XML文档中也存在着环。在XML文档中,某些元素的定义不能准确的表示元素的语义,使得在查询特定内容,而又缺少上下文语义关系的情况下,不能准确得到查询结果,这就是查询二义性问题。本文从一个全新的角度对XML数据的规范化进行了研究,定义了基于DTD的XML环,并设计了DTD中XML环的判定算法和重新定义元素的DTD中XML环的消除算法。本文从研究XML文档的查询二义性出发,首先,分析多种存在环结构的DTD,总结其结构特点,据此定义了基于DTD的XML环,并根据环结构特点的不同进行了分类。根据XML环的定义,进一步分析存在环的DTD,发现某些元素存在多个父元素或者根元素也成为其他元素的子元素这个特点,根据这个特点设计DTD中XML环的判定算法。其次,分析在XML文档中如何消除查询二义性,并设计XML文档中消除二义性的方法。根据存在环的DTD的特点和DTD中XML环的判定算法的结果,设计基于重新定义元素的DTD中XML环的消除算法,使DTD满足X1NF,并指出使用该算法消除XML环以后还存在的一些问题。最后结合其他文献提出的使DTD满足X2NF和X3NF的算法,设计DTD满足XNF的算法。本文设计的XML的判定算法和XML环的消除算法能嵌入到一些DTD和XML的编辑器的功能模块中,具有实用意义。