XML文档相似性的研究及其在软件构件聚类中的应用

XML文档相似性的研究及其在软件构件聚类中的应用

论文摘要

随着基于构件的软件开发技术的推广和深入发展,构件库已经在软件研究领域得到越来越多的关注。构件的查询是构件库的基本功能,利用聚类分析技术对构件进行聚类,可以实现构件的自动分类,有效地提高构件的查询效率。因为构件可以采用XML文档描述,而描述文档可以作为构件的标识,所以对构件的聚类可以转换为对其XML描述文档的聚类。因此对XML文档相似性和软件构件聚类进行研究具有非常重要的意义。XML文档是结构信息和语义信息的综合体,因此XML文档相似性的研究需要将结构信息和语义信息两者相结合。首先,XML文档中非叶子节点重复出现使得相似性计算复杂化,通过重复约简和嵌套约简消除非叶子节点的重复,使得XML文档结构简化;然后,分析XML文档特征,对前人提出的结构化递归模型作了扩展,利用元素间的有序嵌套来体现XML文档的结构信息,充分考虑标签、标签的权重以及叶子节点值及其权重,使用WordNet和自定义的相似字典SD来计算XML文档标签的语义信息,通过给出的公式计算叶子节点的相似性,依据其结构特点给出标签和叶子节点的权重;最后,给出XML相似性计算的层次递归算法。本文采用通用的刻面描述方案来描述构件,并以XML作为构件描述的标记语言。根据XML相似性的层次递归算法得到相似性矩阵,然后通过凝聚式层次聚类算法实现对构件描述文档的聚类。实验表明XML相似性的层次递归算法可以有效地计算XML文档之间的相似性,在此基础上的构件描述文档聚类能有效满足软件构件聚类的要求。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 课题的提出及研究意义
  • 1.2 国内外研究现状
  • 1.3 主要研究内容
  • 1.4 论文组织结构
  • 第二章 XML 文档及聚类分析
  • 2.1 XML 文档
  • 2.1.1 文档结构
  • 2.1.2 文档解析
  • 2.1.3 文档查询
  • 2.2 聚类分析
  • 2.2.1 聚类概念
  • 2.2.2 聚类算法
  • 2.2.3 聚类应用
  • 2.2.4 算法评价
  • 2.3 小结
  • 第三章 XML 相似性的层次递归算法
  • 3.1 传统的相似性计算方法
  • 3.2 XML 文档特征分析
  • 3.3 XML 文档结构约简
  • 3.3.1 非叶子节点重复与嵌套
  • 3.3.2 约简算法描述
  • 3.4 标签语义相似性计算
  • 3.4.1 基于词典的词语相似性计算
  • 3.4.2 SD(相似字典)
  • 3.5 XML 相似性的层次递归计算模型
  • 3.6 XML 相似性的层次递归算法
  • 3.6.1 对应节点选择方法
  • 3.6.2 叶子节点值相似性的计算
  • 3.6.3 算法描述
  • 3.7 算法分析
  • 3.8 小结
  • 第四章 基于XML 相似性的软件构件聚类
  • 4.1 基于XML 的构件描述文档
  • 4.1.1 软件构件定义
  • 4.1.2 基于XML 的构件描述文档
  • 4.2 文档相似性矩阵
  • 4.3 XML 文档聚类
  • 4.3.1 算法思想
  • 4.3.2 簇的数据结构
  • 4.3.3 算法描述
  • 4.4 算法分析
  • 4.5 小结
  • 第五章 实验结果与分析
  • 5.1 实验环境
  • 5.2 测试数据集
  • 5.3 实验结果与分析
  • 5.4 小结
  • 结论
  • 参考文献
  • 攻读硕士学位期间取得的学术成果
  • 致谢
  • 相关论文文献

    • [1].基于XML的公交查询系统设计[J]. 科教文汇(下旬刊) 2012(07)
    • [2].XML技术的房地产估价数据标准研究[J]. 中国房地产 2013(24)
    • [3].《XML技术》线上教学的实践和探索[J]. 科技风 2020(33)
    • [4].基于XML的分布式异构数据库变化捕捉及动态同步系统实现[J]. 铁路计算机应用 2013(10)
    • [5].浅议XML技术在计量检测管理系统中的应用[J]. 科技致富向导 2013(30)
    • [6].XML函数依赖研究综述[J]. 计算机工程与科学 2014(02)
    • [7].基于XML的异构数据交换研究与实现[J]. 石家庄学院学报 2014(03)
    • [8].基于XML的电子政务数据交换平台设计[J]. 安徽冶金科技职业学院学报 2014(02)
    • [9].运用XML实现异构数据库的数据转换[J]. 电脑知识与技术 2013(08)
    • [10].XML技术的异构数据库数据双向存取模型[J]. 安顺学院学报 2013(02)
    • [11].基于XML的数据客体与安全标记绑定方法[J]. 计算机科学 2013(08)
    • [12].基于XML的光交叉连接节点描述[J]. 通信技术 2013(07)
    • [13].XML加密技术在居民健康档案中的应用[J]. 保密科学技术 2013(05)
    • [14].XML有序多重签名在公文流转系统中的应用[J]. 电脑知识与技术 2013(25)
    • [15].基于轴结点的XML函数依赖及推理规则[J]. 计算机与数字工程 2012(01)
    • [16].XML语言在综合监控系统视频控制中的应用[J]. 工业控制计算机 2012(02)
    • [17].如何进行XML的异构数据库数据的转换[J]. 硅谷 2012(09)
    • [18].基于XML的电子政务工作流模型的研究与实现[J]. 电脑知识与技术 2012(21)
    • [19].XML电子公文多重签名方法研究[J]. 北京电子科技学院学报 2012(02)
    • [20].浅析XML技术在组织机构代码数据交换中的应用[J]. 标准科学 2012(04)
    • [21].基于XML的教学资源库系统研究[J]. 信息技术 2012(11)
    • [22].一种基于领域知识的XML数据模糊查询[J]. 智能系统学报 2012(06)
    • [23].面向广义特征的机器人零件模型表达及XML描述[J]. 中国制造业信息化 2012(23)
    • [24].基于XML全文数据引文分析系统的设计与实现[J]. 现代图书情报技术 2012(11)
    • [25].基于ASP.NET与XML的异构数据库数据交互解析与实现[J]. 计算机与现代化 2011(01)
    • [26].基于XML的电子公文交换[J]. 兰台世界 2011(02)
    • [27].XML与动态指标管理在土地适宜性评价中的应用[J]. 测绘工程 2011(01)
    • [28].XML技术在网络化虚拟仪器中的应用探索[J]. 现代科学仪器 2011(01)
    • [29].基于XML的校园网站信息共享[J]. 长春师范学院学报 2011(02)
    • [30].试析基于XML的结构化电子病历[J]. 电脑编程技巧与维护 2011(10)

    标签:;  ;  ;  ;  ;  

    XML文档相似性的研究及其在软件构件聚类中的应用
    下载Doc文档

    猜你喜欢