导读:本文包含了缺陷度量论文开题报告文献综述及选题提纲参考文献,主要关键词:数据度量,数据挖掘,多目标决策,软件缺陷检测
缺陷度量论文文献综述
陈顺义[1](2018)在《基于数据度量和多目标决策的软件缺陷技术研究》一文中研究指出软件缺陷是软件开发过程中不可避免的“副产品”,不仅影响着软件的质量还可能导致软件的开发费用超支和开发进度失控,甚至会导致灾难性的结果。软件中存在的缺陷并非靠简单地检测和验证手段就能发现或排除的,因此,软件缺陷检测技术必不可少。一方面,在以往的研究过程中,软件缺陷检测模型的研究思路焦点都聚集在分类器的设计上,而忽略了数据复杂性特征。另一方面,检测模型评估指标多种多样,很难直观的判断出哪些模型指标是否是合格或者说是有利的,因此拥有稳定的评估技术是非常重要的。针对上诉问题,本文提出基于数据度量的软件缺陷检测方法和基于多目标决策的评估方法研究:(1)提出了基于数据度量的软件缺陷检测方法,其将数据挖掘技术中数据复杂性度量应用到软件工程的软件缺陷检测模型中。首先引入11个数据复杂性度量指标对所有数据进行度量,然后使用当前较流行的叁种数据挖掘算法最近邻分类算法、决策树算法和朴素贝叶斯分类算法对所有数据进行检测,并采用多个评估指标来表示,最后根据实验结果探讨数据集的复杂性度量与软件缺陷检测之间的关系,从而为软件缺陷检测模型的建立提供有力的支持。实验结论表明,数据复杂度量可以为分类器的选择提供有效的信息,同时为建立稳定的检测模型提供了有力的支撑。(2)提出了一种基于多目标决策算法的评估方法。多目标决策算法主要采用的方法是层次分析法(Analytic Hierarchy Process,AHP)和模糊数学法,该技术适用解决多输入以及多输出的问题。在后期实验中主要采用了层次分析法作为建模对象,以及会涉及到层次分析法的一些变形的方法模糊层次分析法(Fuzzy AHP)等。首先,将影响因素分解成目标、准则、方案等层次,在此基础之上在使用层次分析法对决策进行定性和定量分析。使用了机器学习中多个度量指标建立多目标决策评估方法,所得的数据来确立优化的评估算法。然后,在层次分析法上进行变形成Fuzzy AHP模型进行相同试验,比较二者的不同之处,以及实验结果。最后,分析出所要的多目标决策模型。实验的结论展示了通过层次分析法得出的一个解再通过Fuzzy AHP的方法,可以将其转化为定量分析,在5个划分的标准之中找到对于该解的评价,以确定该解是否符合预期。(本文来源于《华侨大学》期刊2018-07-21)
王铁建[2](2018)在《基于度量的软件缺陷预测研究》一文中研究指出软件系统在人类社会中有着日益广泛而深入的应用,其可靠性十分重要。随着软件系统规模与复杂度的迅速增长,在资源有限的情况下,完全依赖传统的软件测试方法很难找出软件系统当中的全部缺陷。静态软件缺陷预测技术能够借助通过软件度量获得的历史数据,利用机器学习方法构造出软件缺陷预测模型,进而对新的软件模块进行预测,判定这些新模块当中是否存在缺陷,为提高软件系统的可靠性提供有效的决策支持。软件缺陷预测包括获取模块标记、提取模块特征、构造预测模型、进行缺陷预测等基本步骤。缺陷预测所用的历史数据是通过进行软件度量获得的,这些缺陷数据存在结构复杂、类不平衡、标记样本不足、不同数据集等问题;此外,在进行软件缺陷预测的过程中,还需要考虑误判风险成本问题。针对上述软件缺陷预测当中的问题,提出了核字典学习、多核集成学习、半监督集成学习等软件缺陷预测方法。论文的研究内容主要包含如下方面:(1)提出了一种基于核字典学习的软件缺陷预测方法。将核方法与字典学习结合起来,首先根据软件缺陷历史数据结构复杂、类不平衡的特点,利用核方法将软件缺陷历史数据映射到一个能代表原始数据分布的高维特征空间。然后在核空间中,通过学习得到一个核字典,利用这个核字典判定软件模块的标记,对软件模块进行缺陷预测。在核字典学习过程中,采用了一种核字典基选择策略,构造出一个类别平衡的核字典,解决了软件缺陷预测当中的类不平衡问题。(2)提出了一种基于多核集成学习的软件缺陷预测方法。多核集成学习方法能够利用集成学习来获得最优的多核分类器,使得该方法在用于软件缺陷预测时,能够兼有多核学习与集成学习的优点。考虑到软件缺陷预测中的风险成本,设计了一种新的样本集权重向量更新策略,在多核集成学习的训练过程中,根据分类结果,逐步增加有缺陷模块权重,同时降低无缺陷模块的权重,从而增加对有缺陷模块的关注程度,降低把有缺陷模块预测为无缺陷模块的风险,提高软件缺陷预测的效果。(3)提出了一种基于半监督集成学习的软件缺陷预测方法。将半监督学习与集成学习结合起来,不仅能够充分利用大量存在的未标记模块进行训练,在标记样本不足的情况下增强对分类器的训练,同时还能够解决软件缺陷历史数据本身存在的类不平衡问题,从而提高软件缺陷的预测效果。考虑到相似度矩阵的重要作用,在求取相似度矩阵时,采用了非负稀疏编码的方法,以获得更加稳定学习效果更好的相似度矩阵,提高半监督集成学习的缺陷预测效果。在NASA MDP数据集上的实验表明,论文当中提出的核字典学习缺陷预测方法、多核集成学习缺陷预测方法、半监督集成学习缺陷预测方法均获得了较好的软件缺陷预测效果。(本文来源于《武汉大学》期刊2018-05-01)
娄丰鹏,吴迪,荆晓远,吴飞[3](2018)在《增加度量元的迁移学习跨项目软件缺陷预测》一文中研究指出目前,结合机器学习方法和软件缺陷预测技术自动地学习模型来发现软件中的缺陷,已经成为跨项目缺陷预测的主要方法。由于源项目和目标项目之间的特征分布差异,跨项目相关性预测的表现通常较差。针对该问题,可以使用从源项目中提取知识并将其转移到目标项目的转移学习技术来提高预测性能,并提出了一种增加度量元的迁移学习方法进行跨项目的软件缺陷预测。该方法首先使用分类器对数据集进行一次项目内预测,并将预测结果作为新的度量元加入数据集。然后采用迁移学习方法将源项目中提取的知识转移至目标项目,并使用分类器预测目标项目。在AEEEM数据集上的实验结果表明,该算法提高了跨项目软件缺陷预测效率。(本文来源于《计算机技术与发展》期刊2018年07期)
史作婷,吴迪,荆晓远,吴飞[4](2018)在《类不平衡稀疏重构度量学习软件缺陷预测》一文中研究指出软件缺陷预测是提升软件质量的重要手段。为了改善缺陷预测性能,目前许多机器学习领域的最新成果已经引入到软件缺陷预测中。但是,软件缺陷预测数据通常存在类别分布不平衡的问题,这会影响预测效果。针对这个问题,提出了类不平衡稀疏重构距离度量学习软件缺陷预测方法。该方法首先在度量学习中加入代价敏感因素,学习距离度量特征矩阵并解决软件缺陷预测中分类错误代价不同的问题。其次,通过在目标函数中加入权重来进一步提高小类样本距离度量学习的准确性。最后,为了解决预测阶段数据集的类别不平衡问题,采用了改进加权KNN算法预测测试样本标签。在NASA软件缺陷预测标准数据集上的实验结果证明了该方法能提高召回率与F-measure值,改善分类性能。(本文来源于《计算机技术与发展》期刊2018年06期)
Qiao,YU,Shu-juan,JIANG,Rong-cun,WANG,Hong-yang,WANG[5](2017)在《一种面向软件缺陷预测的相似性度量特征选择方法(英文)》一文中研究指出软件缺陷预测旨在通过历史数据和能反映软件模块特性的软件特征来发现潜在缺陷。然而,有的特征可能与类别(有缺陷或无缺陷)的相关性较高,有的特征可能是冗余的或无关的。针对软件缺陷预测中不同特征与类别的相关性差异,本文提出一种基于相似性度量(similarity measure,SM)的特征选择方法。首先,根据不同类样本间的相似性来更新特征权重;然后,按照特征权重值降序排列生成特征排序列表,并依次选取特征排序列表中的所有特征子集;最后,在KNN(k-nearest neighbor)模型上验证所有特征子集的分类性能,并采用AUC(area under curve)指标进行度量。在11个美国航空航天局(NASA)数据集上进行实验验证,结果表明,与其它四种特征选择方法相比,本文方法具有与之相当甚至更高的分类性能。(本文来源于《Frontiers of Information Technology & Electronic Engineering》期刊2017年11期)
万琳,杨腾翔,刘海宁[6](2017)在《缺陷数据的相似性度量方法改进》一文中研究指出模糊聚类分析主要研究样本的分类问题.本文利用模糊聚类方法对软件缺陷进行分类,引入缺陷数据属性权重计算方法,依据数据挖掘中的属性邻近性度量方法,对缺陷数据进行相似度分析.并按照属性类别进行分析,不仅体现了缺陷数据属性间的形贴近程度,而且体现了属性之间的距离贴近程度.本文方法对软件缺陷数据进行分析并对比度量结果,实验结果充分说明改进后的模糊聚类相似性度量方法在分类准确性方面有一定程度的提高.(本文来源于《计算机系统应用》期刊2017年08期)
李克文,王义龙,邵明文,刘文英[7](2017)在《基于软件缺陷的可信证据度量模型》一文中研究指出为克服软件可信性评估过程中可信证据正面度量收集数据困难的问题,提出基于软件缺陷的可信证据度量模型(trustworthy evidence measurement model based on software defects,TEMMSD),利用软件系统中存在的缺陷类型、数目以及缺陷严重程度等因素,从侧面实现可信证据度量。通过软件开发者、第叁方测评和用户反馈3个方面采集、获取软件生命周期中不同阶段存在的缺陷数据并对初始数据进行预处理,运用正交缺陷分类法对缺陷数据进行缺陷分析并可信归类,从主客观的角度确定缺陷类型的权重,实现软件系统的缺陷证据度量。对石油企业自然递减跟踪系统进行实例分析,分析结果表明,TEMMSD模型在软件可信证据度量中具有可行性和有效性。(本文来源于《计算机工程与设计》期刊2017年03期)
王晴[8](2016)在《基于距离度量学习的软件缺陷预测方法研究》一文中研究指出随着计算机技术的不断发展,如何准确地预测出软件中潜在的缺陷显得至关重要。有效地利用软件开发工程中的历史数据,帮助预测新开发的软件工程中的缺陷信息,既能提升软件开发质量,也能很大程度上节省软件测试工作量。近年来,研究者们尝试把一些机器学习方法应用到软件缺陷预测领域中,但是这些方法在训练模型的过程中大多使用传统的欧氏距离。许多研究表明,欧氏距离并不能很好地体现样本之间的鉴别性。距离度量学习方法通过挖掘训练样本集的特征信息和标记信息,学习得到有效的距离度量,让样本在基于度量矩阵的新特征空间中具有更好的鉴别可分性。本文从距离度量学习的角度出发,提出了一系列有效的基于距离度量学习的软件缺陷预测方法。首先,本文提出了基于特定簇大间隔最近邻距离度量学习的软件缺陷预测方法(CS-LMNN)。该方法的基本思路是,首先使用大间隔最近邻距离度量学习方法(LMNN)学习一个全局鉴别度量矩阵,然后再把训练集使用聚类算法聚类为K个簇,每个簇学习各自的特定簇鉴别度量矩阵。在预测时,先用全局鉴别度量方式为测试样本选定近邻样本所在的簇,然后再使用该特定簇的鉴别度量方式预测出测试样本是否有缺陷。其次,为了解决训练集中存在的噪声问题,本文在距离度量学习中融入局部稀疏重构信息,提出基于特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(CS-LSRML)。该方法的基本思路是,利用距离度量矩阵计算稀疏表示项,并融入了局部加权因子,设计了类内局部稀疏重构项和类间局部稀疏重构项。该方法既可以学习鉴别性很好的度量矩阵,又融入了稀疏表示中对噪声鲁棒的优点。最后,为了解决软件缺陷预测中的数据类不平衡问题,本文又融合了上采样和下采样技术,提出了基于上采样的特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(OCS-LSRML)和基于下采样的特定簇局部稀疏重构距离度量学习的软件缺陷预测方法(UCS-LSRML)。这两个方法的基本思路是,先通过两种采样技术,将不平衡数据集转换为相对平衡的数据集,然后再使用上面提出的距离度量学习方法学习全局鉴别度量矩阵和特定簇鉴别度量矩阵。本文在NASA、AEEEM和ReLink软件工程数据库进行实验。实验结果充分验证了本文所提方法的有效性,并且和目前代表性软件缺陷预测方法的效果相比,有一定程度的提高。(本文来源于《南京邮电大学》期刊2016-11-18)
王晴,荆晓远,朱阳平,吴飞,董西伟[9](2016)在《基于局部稀疏重构度量学习的软件缺陷预测》一文中研究指出随着计算机技术的不断发展,如何准确地预测出软件中潜在的缺陷显得至关重要。近年来,研究者们尝试把一些机器学习方法应用到软件缺陷预测领域中,但是这些方法在分类过程中大多使用了传统的欧氏距离。距离度量学习方法通过挖掘训练样本集的特征信息和标记信息,学习得到有效的距离度量,让样本在基于度量矩阵的新特征空间中具有更好的鉴别可分性。将距离度量学习方法引入到软件缺陷预测中,同时融入了局部稀疏重构信息,提出一种新的软件缺陷预测方法,即局部稀疏重构度量学习方法(LSRML)。该方法学习得到的距离度量具有很好的鉴别性,并有效地解决了噪声敏感问题。在软件工程NASA数据库上的实验结果表明,提出的方法具有较好的缺陷预测效果。(本文来源于《计算机技术与发展》期刊2016年11期)
董萌[10](2016)在《缺陷关联系数度量技术研究》一文中研究指出随着计算机技术的发展,软件质量问题和软件产品生产率低下等问题越来越受到人们的重视。在软件工程领域,尽管人们提出和采用了许多提高软件质量的技术和方法,但软件测试一直是保证软件质量的主要途径。目前,缺陷关联技术已成为软件测试的一个重要研究方向,好的缺陷关联技术能够极大地减少测试工作量,降低测试成本,提高软件缺陷排除效率。因此,对用于指导缺陷关联技术的软件测试策略进行深入研究具有重要意义。尽管人们已经认识到了软件失效之间存在关联关系,但对这一现象还缺乏深入的研究,没有从软件失效的根源,也就是软件缺陷的角度来分析关联的原因,进一步的精确缺陷之间的关联程度。基于缺陷管理的软件测试方法通过收集缺陷信息,构建缺陷管理库并对缺陷信息进行分析和度量,使得分散的缺陷数据井然有序,然后采用各种方法对缺陷数据进行处理,分析缺陷之间的关联关系,以提高缺陷剔除效率。本文在已有的研究基础上对缺陷关联系数技术进行了深入的研究,主要包括以下几个方面:(1)研究了缺陷管理系统中的缺陷正交分类方法和聚类分析的相似度量方法。针对已有缺陷关联度量中对缺陷传播数据度量的不足,构建了一种以缺陷正交分类方法为背景,聚类分析法相似度计算方法为基础的缺陷特征相似度模型,该模型与实际的软件测试过程更接近,具有更高的实用性。(2)研究了缺陷管理系统中缺陷关联与组件关联之间的关系。通过研究和分析缺陷传播过程中与面向对象组件之间的传递关系,设计了一种组件间的耦合度策略,以此间接度量缺陷间耦合度。(3)研究了缺陷传递及缺陷关联系数传递策略。通过建立缺陷特征相似度、缺陷间耦合度与软件缺陷关联系数之间的关系,根据缺陷的传递性建立了缺陷关联规则。最后提出设计了一种基于缺陷传递的缺陷关联系数调整策略,实现对缺陷关联系数的调整,对缺陷关联矩阵进行更新。最后,本文设计一系列仿真实验,验证了缺陷特征相似度、缺陷间耦合度在度量缺陷关联系数过程中所做的贡献,证实缺陷关联系数调整策略的可行性。实验结果表明,与传统缺陷关联策略、缺陷放回策略及优化关联测试策略相比,本文提出的策略能够在更短的时间内完成同等质量的测试任务,从而提高测试效率。(本文来源于《浙江理工大学》期刊2016-04-15)
缺陷度量论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
软件系统在人类社会中有着日益广泛而深入的应用,其可靠性十分重要。随着软件系统规模与复杂度的迅速增长,在资源有限的情况下,完全依赖传统的软件测试方法很难找出软件系统当中的全部缺陷。静态软件缺陷预测技术能够借助通过软件度量获得的历史数据,利用机器学习方法构造出软件缺陷预测模型,进而对新的软件模块进行预测,判定这些新模块当中是否存在缺陷,为提高软件系统的可靠性提供有效的决策支持。软件缺陷预测包括获取模块标记、提取模块特征、构造预测模型、进行缺陷预测等基本步骤。缺陷预测所用的历史数据是通过进行软件度量获得的,这些缺陷数据存在结构复杂、类不平衡、标记样本不足、不同数据集等问题;此外,在进行软件缺陷预测的过程中,还需要考虑误判风险成本问题。针对上述软件缺陷预测当中的问题,提出了核字典学习、多核集成学习、半监督集成学习等软件缺陷预测方法。论文的研究内容主要包含如下方面:(1)提出了一种基于核字典学习的软件缺陷预测方法。将核方法与字典学习结合起来,首先根据软件缺陷历史数据结构复杂、类不平衡的特点,利用核方法将软件缺陷历史数据映射到一个能代表原始数据分布的高维特征空间。然后在核空间中,通过学习得到一个核字典,利用这个核字典判定软件模块的标记,对软件模块进行缺陷预测。在核字典学习过程中,采用了一种核字典基选择策略,构造出一个类别平衡的核字典,解决了软件缺陷预测当中的类不平衡问题。(2)提出了一种基于多核集成学习的软件缺陷预测方法。多核集成学习方法能够利用集成学习来获得最优的多核分类器,使得该方法在用于软件缺陷预测时,能够兼有多核学习与集成学习的优点。考虑到软件缺陷预测中的风险成本,设计了一种新的样本集权重向量更新策略,在多核集成学习的训练过程中,根据分类结果,逐步增加有缺陷模块权重,同时降低无缺陷模块的权重,从而增加对有缺陷模块的关注程度,降低把有缺陷模块预测为无缺陷模块的风险,提高软件缺陷预测的效果。(3)提出了一种基于半监督集成学习的软件缺陷预测方法。将半监督学习与集成学习结合起来,不仅能够充分利用大量存在的未标记模块进行训练,在标记样本不足的情况下增强对分类器的训练,同时还能够解决软件缺陷历史数据本身存在的类不平衡问题,从而提高软件缺陷的预测效果。考虑到相似度矩阵的重要作用,在求取相似度矩阵时,采用了非负稀疏编码的方法,以获得更加稳定学习效果更好的相似度矩阵,提高半监督集成学习的缺陷预测效果。在NASA MDP数据集上的实验表明,论文当中提出的核字典学习缺陷预测方法、多核集成学习缺陷预测方法、半监督集成学习缺陷预测方法均获得了较好的软件缺陷预测效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
缺陷度量论文参考文献
[1].陈顺义.基于数据度量和多目标决策的软件缺陷技术研究[D].华侨大学.2018
[2].王铁建.基于度量的软件缺陷预测研究[D].武汉大学.2018
[3].娄丰鹏,吴迪,荆晓远,吴飞.增加度量元的迁移学习跨项目软件缺陷预测[J].计算机技术与发展.2018
[4].史作婷,吴迪,荆晓远,吴飞.类不平衡稀疏重构度量学习软件缺陷预测[J].计算机技术与发展.2018
[5].Qiao,YU,Shu-juan,JIANG,Rong-cun,WANG,Hong-yang,WANG.一种面向软件缺陷预测的相似性度量特征选择方法(英文)[J].FrontiersofInformationTechnology&ElectronicEngineering.2017
[6].万琳,杨腾翔,刘海宁.缺陷数据的相似性度量方法改进[J].计算机系统应用.2017
[7].李克文,王义龙,邵明文,刘文英.基于软件缺陷的可信证据度量模型[J].计算机工程与设计.2017
[8].王晴.基于距离度量学习的软件缺陷预测方法研究[D].南京邮电大学.2016
[9].王晴,荆晓远,朱阳平,吴飞,董西伟.基于局部稀疏重构度量学习的软件缺陷预测[J].计算机技术与发展.2016
[10].董萌.缺陷关联系数度量技术研究[D].浙江理工大学.2016