论文摘要
网格(Grid)是20世纪90年代提出的新技术,它的目标是将地理上分布、异构的各种资源通过高速互联网络连接并集成起来,实现资源的高度共享,共同完成一些重大应用研究问题。数据网格(Data Grid)则是网格技术在数据管理方面的延伸,它试图隐藏分布、异构的数据资源在存储介质、存储方式、存储位置等具体细节上的不同,提供给用户统一的逻辑视图,使他们可以方便、快速、高效地访问数据。作为一种新兴的技术与架构,数据网格将为数据库集成系统研究带来新的解决思路与方法。本文紧紧围绕着网格环境下的医疗信息系统集成这一主题,研究利用数据网格技术对分布异构的医疗信息系统数据库进行集成。首先,本文设计了适于网格环境的医学数据库集成系统的元数据模型;然后,基于该元数据模型和其它功能模块,提出了一种基于网格技术的医疗信息系统集成模型,并在实验环境下组建了原型系统以测试模型的有效性;最后,针对信息系统集成过程中存在语义异构问题,本文进一步探讨了医疗信息系统的数据库属性的语义匹配问题,提出了一种基于人工神经网络的属性匹配方法,从而将对医学数据库集成的研究从一般的数据集成深入到了语义集成的范畴。论文的主要内容以及创新点包括:1)网格环境下医学数据库集成系统的元数据建模元数据是数据管理中的重要技术环节。根据医疗信息系统的数据特点,本文设计了适合于网格环境的医疗信息系统数据库集成的元数据模型。根据不同的用途和访问需求定义相应的元数据类型,从而扩展了数据管理范围,增强了数据访问的安全性,使数据对象之间的关系表达更加自然;采用层次式的元数据管理结构,适应了网格环境的特点,提高了数据访问效率,从而为医疗信息系统数据库集成模型的设计奠定了基础。2)网格环境下医疗信息系统数据库集成模型的设计与研究结合医学数据库的特点,本文提出了一种适于网格环境的医疗信息系统数据库集成模型,通过相关的网格组件和服务,使各种异构的医学数据库可以被当作单一的逻辑资源来进行访问。在介绍了模型的总体架构之后,根据模型的基本功能划分,分别对数据集成、查询处理、数据传输以及元数据管理等功能模块的设计实现进行了详细的阐述与分析。在实验环境下组建的原型系统上进行的模拟数据查询测试验证了模型设计的有效性。3)异构医学数据库的语义集成研究异构数据库语义集成的基本任务就是在不同的数据库中找出语义相关的属性,解决数据冲突,提供给用户一个统一的逻辑视图。这对于建立适合于动态网格环境的元数据模型,进一步改进医疗信息系统数据库集成的效果,提高系统的可用性,扩展系统的应用范围十分重要。本文将人工神经网络技术运用于医学数据库属性的语义集成研究,经过量化及规范化处理的属性的元数据信息和内容值的统计信息等组成该属性的特征向量,用于对神经网络进行训练,训练好的神经网络系统即可用于对具有语意关联性的数据库属性进行识别。为了提高属性匹配的准确率,本文在对神经网络进行训练前,首先根据各属性之间的相似性建立多个分类器,利用分类器的输出作为训练样本,从而有效地降低了训练数据的规模,缩短了训练时间,同时提高了属性匹配的准确率。在模拟环境下进行的实验显示了该方法的有效性。