论文摘要
信用风险评估技术对于金融机构具有重要意义。机器学习技术能显著地提高信用风险评估的准确度与适应性。本文提出三种新的基于机器学习的信用风险评估模型。提出基于特征信用和支持向量域描述的信用风险评估模型。首先计算特征信用即提取信用好的客户样本的主成分,然后将所有样本映射进特征信用所张成的子空间中,信用好的客户样本在特征信用空间中分布更紧凑,最后在变换后的样本数据上用支持向量域描述建立信用风险评估模型,该模型适用于在信用数据样本分布不平衡的情况下进行信用风险评估。实验结果表明,在信用数据样本分布不平衡的情况下,基于特征信用和支持向量域描述的信用风险评估模型能较好地检测出不良贷款。提出Weightly Selected Attribute Bagging集成学习方法,并用其建立信用风险评估模型,该模型的实现分为两个步骤。首先计算各特征分量的权重,然后构造特征分量的子集,权重越大特征分量被选入特征分量子集的概率越大,将训练样本依次映射进特征子集空间,在各特征子集空间中建立子分类器,最后各子分类器投票给出最终分类结果。这样可以删除掉一些冗余特征并且可以保持子分类器之间的多样性,从而能提高集成学习的效果。实验结果表明,相比于其他集成学习方法,Weightly Selected Attribute Bagging算法能更好地提高单个分类器的分类性能。提出基于核匹配追踪算法及核匹配追踪集成的信用风险评估模型。核匹配追踪是利用贪婪算法在由核函数构成的基函数字典中搜寻一组基函数的线性组合来逼近目标函数,该基函数的线性组合即为所要求解的预测函数。核匹配追踪集成是指利用多个核匹配追踪模型来投票决定最终的分类结果。实验结果表明,核匹配追踪算法可以被应用于信用风险评估,具有精度高、训练时间短以及解的稀疏性好等优点;核匹配追踪集成可以较好地解决大规模数据集的分类问题。
论文目录
摘要Abstract第1章 绪论1.1 研究背景1.1.1 本论文研究的目的和意义1.1.2 信用风险评估研究历史和研究现状1.1.3 机器学习与信用风险评估1.2 本文主要研究工作和创新点1.2.1 本文研究方法和目的1.2.2 主要研究工作简述1.2.3 创新点1.3 论文组织结构第2章 基于 EIGENCREDITS 和 SVDD 的信用风险评估模型2.1 模型简介2.2 Eigencredits2.2.1 Eigencredits 的概念2.2.2 Eigencredits 的计算2.3 Support Vector Data Description(SVDD)2.3.1 训练集只包含正类样本的SVDD2.3.2 训练集包含正类样本和负类样本的SVDD2.4 实验2.4.1 在完整数据集上的实验2.4.2 在包含少部分负类样本集上的实验2.5 小结第3章 基于 WEIGHTLY SELECTED ATTRIBUTE BAGGING 算法的信用险评估模型3.1 模型简介3.2 相关方法简介3.2.1 基于数据分划的集成学习方法3.2.2 基于特征分划的集成学习方法3.3 Weightedly Selected Attributes Bagging (WSAB)3.3.1 评估特征的权重3.3.2 用线性支持向量机(LSVM)来评估特征的权重3.3.3 用主成分分析(PCA)来评估特征的权重3.3.4 Weightedly Selected Attributes Bagging3.4 实验3.4.1 用线性SVM 评估各特征分量的权重3.4.2 用PCA 评估各特征分量的权重3.4.3 特征子集的大小对AB 模型的影响3.4.4 WSAB 方法和传统的集成分类模型之间的比较3.5 小结第4章 基于 KMP 的信用风险评估模型4.1 模型简介4.2 核匹配追踪4.2.1 匹配追踪算法4.2.2 基于后系数调整的匹配追踪算法4.2.3 核匹配追踪算法4.2.4 误差函数的选择4.2.5 基于核匹配追踪的分类器4.3 核匹配追踪算法集成4.4 实验4.4.1 单个核匹配追踪算法的性能4.4.2 核匹配追踪集成算法的性能4.5 小结结论参考文献攻读学位期间发表的论文与研究成果清单致谢
相关论文文献
标签:信用风险评估论文; 特征信用论文; 支持向量域描述论文; 核匹配追踪论文;