基于向量空间范围搜索的大型软件相似度检测

基于向量空间范围搜索的大型软件相似度检测

论文摘要

不同软件系统中相近似的代码模块的出现,是理解和重构软件系统的一个重要出发点。就软件工程的角度而言,相似代码模块的检测可以更好的检验系统;可以方便对软件系统进行重构;可以在度量相似和差异的基础上协助版本管理;进而还可以在产品线的层面上,给出量化的版本之间相似度的结果,从而有助于更有效的项目管理。由此可见软件相似度的研究有其重要的现实意义。本文关注于大型软件系统的相似检查。现有的软件相似检测的方法基于对软件相似的不同定义,没有一个坚实的框架来支持大型软件系统的相似分析。本文比较了当前的检测技术,针对大型软件系统相似检测需要,指出了基于度量空间的解决方向。文章在分析软件特征的基础上挑选了适当的软件系统度量,并给出了软件相似度及其量化结果的形式化定义。然后在向量空间搜索的理论框架下探讨了近似搜索算法,得到了适合大型软件向量空间应用的合适算法。最后,本文基于上述解决方案给出了一个大型软件系统相似检测器的设计实现,并在大的模拟样本数据集上进行了实验。对于软件度量空间相似检测时涉及的重要参数,实验分析指出了它们对相似检测结果以及效率的影响,为其它软件系统的度量相似检测实践提供了有力的参考。自此形成了一个对大型软件系统进行相似检测的完整框架。

论文目录

  • 摘要
  • Abstract
  • 第1章 绪论
  • 1.1 课题背景
  • 1.2 研究内容和目标
  • 1.3 论文组织
  • 第2章 软件相似度及其检测方法综述
  • 2.1 软件相似度以及定义
  • 2.2 软件相似的表现
  • 2.3 软件相似检测流程
  • 2.4 软件系统相似检测算法比较
  • 2.5 本章小节
  • 第3章 基于软件系统度量空间的搜索算法
  • 3.1 软件系统的度量
  • 3.2 基于度量空间表达的软件相似度定义
  • 3.3 基于度量空间的搜索算法
  • 3.3.1 度量空间搜索
  • 3.3.2 基于轴点的空间搜索算法
  • 3.3.3 相关工作
  • 3.4 本章小节
  • 第4章 代码度量检测系统的设计实现
  • 4.1 系统构架和算法需求阐述
  • 4.2 预处理模块
  • 4.3 度量空间映射模块
  • 4.4 相似代码搜索模块
  • 4.5 相似度结果返回模块
  • 4.6 实验结果
  • 4.6.1 度量数量选择与相似结果
  • 4.6.2 度量范围大小与相似结果
  • 4.6.3 轴点个数选择与运行效率
  • 4.7 本章小节
  • 第5章 总结与展望
  • 5.1 总结
  • 5.2 未来工作方向
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].基于曲线相似度的飞行着陆操作评价方法[J]. 交通信息与安全 2019(06)
    • [2].基于域间相似度序数的迁移学习源领域的选择[J]. 科学技术与工程 2020(20)
    • [3].一种图文组合相似度算法的设计与优化[J]. 软件工程 2020(08)
    • [4].基于超网络的微博相似度及其在微博舆情主题发现中的应用[J]. 图书情报工作 2020(11)
    • [5].一种双层的微博用户相似度算法[J]. 情报杂志 2018(06)
    • [6].基于情景的结构化突发事件相似度研究[J]. 中国管理科学 2017(01)
    • [7].基于混合相似度的协同过滤推荐[J]. 软件导刊 2017(02)
    • [8].基于干扰相似度的多话题演化模型[J]. 电信科学 2017(09)
    • [9].软件相似度在成本估算中的应用[J]. 计算机应用与软件 2015(06)
    • [10].一种基于函数依赖的属性相似度调整算法[J]. 上海交通大学学报 2015(08)
    • [11].河马找亲戚[J]. 学生之友(童花果) 2016(12)
    • [12].十个中文流行语翻译[J]. 初中生辅导 2016(36)
    • [13].母爱[J]. 少年月刊 2017(05)
    • [14].说之以理[J]. 人力资源 2020(21)
    • [15].基于多种测度的术语相似度集成计算研究[J]. 情报学报 2013(06)
    • [16].基于余弦相似度分类负荷预测[J]. 电力设备管理 2020(09)
    • [17].基于多尺度相似度特征的答案选择算法[J]. 系统工程与电子技术 2018(06)
    • [18].基于服务相似度的移动用户近似邻居选取方法[J]. 计算机工程 2018(05)
    • [19].基于文本属性的微博用户相似度研究[J]. 计算机技术与发展 2018(05)
    • [20].基于属性相似度的碎多边形自动聚合处理[J]. 测绘与空间地理信息 2013(11)
    • [21].基于共同邻居相似度的社区发现算法[J]. 信息系统工程 2014(05)
    • [22].色谱指纹图谱相似度方法的适应性研究[J]. 中国中医药信息杂志 2012(05)
    • [23].基于向量空间模型附加词义特征的句子相似度研究[J]. 成都信息工程学院学报 2012(03)
    • [24].中国-东盟自贸区二周年的比较研究——基于出口相似度与显性比较优势的分析[J]. 安徽行政学院学报 2012(03)
    • [25].色谱指纹图谱相似度方法的研究进展[J]. 中国实验方剂学杂志 2011(02)
    • [26].基于元相似度的推荐算法[J]. 计算机应用研究 2011(10)
    • [27].互信息启发的相似度组合图像检索算法[J]. 中国图象图形学报 2011(10)
    • [28].相似度法在综合分析投资环境中的应用[J]. 统计与决策 2009(15)
    • [29].一种改进相似度的协同过滤算法实现[J]. 电子科技 2020(02)
    • [30].基于曲线相似度的步态识别研究[J]. 中国新技术新产品 2020(07)

    标签:;  ;  ;  

    基于向量空间范围搜索的大型软件相似度检测
    下载Doc文档

    猜你喜欢