SVDD算法研究及在信用卡欺诈检测中的应用

SVDD算法研究及在信用卡欺诈检测中的应用

论文摘要

随着全球信用卡欺诈交易数量的惊人增长,信用卡欺诈手法的不断翻新,主要表现为:冒用他人信用卡交易和恶意透支、伪造信用卡诈骗、使用作废信用卡诈骗等,由此带来的损失也日益增加。如何能有效、快速、准确地识别出信用卡欺诈交易已成为目前金融界普遍关心的问题。数据挖掘技术的应用为信用卡欺诈提供了智能型的检测方法。已有方法主要是将数据挖掘中的分类方法如贝叶斯算法、决策树算法和神经网络算法应用于信用卡欺诈检测模型中。基于这三类算法的欺诈检测模型存在以下问题:因为是有监督的欺诈检测,所以检测不出新类型的欺诈;建立模型所需数据集都属于银行的保密资料,所用的代表欺诈信息的数据很难找到;因为合法交易往往比欺诈交易多的多,所以存在严重的类别不平衡问题,这种不平衡会导致误分类,以至于分类精度不高。针对以上存在的问题,本文提出将单值分类方法一支持向量数据描述算法(Support Vector Data Description,SVDD)应用到欺诈检测模型的建立中。单值分类方法属于无监督分类方法,只用一类数据建模,能够检测出新类型的欺诈,并且也不存在类别不平衡问题。研究高效的SVDD方法、如何将该方法应用到欺诈检测模型中是本文研究的两个关键点。本文的工作如下:(1)对支持向量数据描述分类方法进行分析,指出SVDD方法的优缺点,分析了将其应用于信用卡欺诈检测模型建立中的优势和不足。(2)提出一种k-means聚类与改进的SVDD算法结合的新的分类算法(KmD-SVDD)。基于分而治之并行计算的思想,先用k-means聚类将整个数据集划分为k个簇,再用改进的SVDD算法并行训练k个簇,最后再对获得的k个局部支持向量集训练,即得到最终的全局决策边界。讨论了聚类个数k对训练时间的影响,并给出了k的选择方法。在合成数据和实际数据集上的实验结果表明,所提算法具有高效率和高分类精度。(3)提出基于蚁群算法的KmD-SVDD参数寻优方法。实验表明,KmD-SVDD算法中正则化参数C和核参数σ的确定对其性能影响很大,为进一步提高分类精度,将蚁群算法应用于KmD-SVDD参数的寻优中。首先由专家经验来确定这两个参数的有效位,C和σ在蚁群系统中由节点值体现,激素物质遗留在蚂蚁所走过的每个节点上,用k-fold交叉验证平均分类错误率作为目标函数值来更新信息素的浓度,这样搜索出来的最终路径代表模型此时具有最好的建模精度。与直接采用交叉验证方法比较,证明了该方法能够进一步提高分类精度。(4)提出基于KmD-SVDD算法的两阶段信用卡欺诈检测模型。该模型利用整群有相似消费行为的持卡人来取代原先单一的持卡人,克服了采用单一持卡人时交易记录数据不足的缺陷。通过与其他模型比较,验证了该模型的有效性。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景和意义
  • 1.2 欺诈检测的发展现状
  • 1.2.1 国外研究现状
  • 1.2.2 国内研究现状
  • 1.2.3 单值分类方法的提出
  • 1.3 主要研究内容
  • 1.4 论文的组织结构
  • 第二章 信用卡欺诈检测相关技术
  • 2.1 信用卡定义
  • 2.2 信用卡风险管理概述
  • 2.2.1 信用卡欺诈风险的概念和特点
  • 2.2.2 信用卡欺诈风险来源
  • 2.2.3 信用卡欺诈风险的分类
  • 2.2.4 信用卡的欺诈风险识别
  • 2.3 数据挖掘方法概述
  • 2.3.1 数据挖掘的定义
  • 2.3.2 数据挖掘的功能
  • 2.3.3 数据挖掘过程
  • 2.3.4 数据挖掘的发展前景
  • 2.4 支持向量数据描述方法简介
  • 2.5 小结
  • 第三章 k-means聚类与SVDD结合的新的分类算法
  • 3.1 已有改进的SVDD方法(D-SVDD)
  • 3.1.1 局部疏密度的计算
  • 3.1.2 D-SVDD算法
  • 3.1.3 Iris数据集上两种算法分类精度比较
  • 3.2 KmSVDD算法
  • 3.2.1 聚类算法简介
  • 3.2.2 KmSVDD算法
  • 3.3 KmD-SVDD算法
  • 3.3.1 KmD-SVDD算法描述
  • 3.3.2 算法复杂度分析
  • 3.4 实验分析
  • 3.4.1 聚类个数k的选择方法
  • 3.4.2 相关算法分类精度的比较
  • 3.5 小结
  • 第四章 KmD-SVDD算法的参数选择
  • 4.1 支持向量数据描述模型选择的意义及方法
  • 4.1.1 模型选择的意义
  • 4.1.2 已有模型选择方法及优缺点
  • 4.2 实验分析两个参数对分类性能的影响
  • 4.2.1 误差惩罚参数C对分类性能的影响
  • 4.2.2 核参数σ对分类性能的影响
  • 4.3 基于蚁群算法的SVDD模型选择
  • 4.3.1 蚁群算法概述
  • 4.3.2 基于蚁群算法的KmD-SVDD参数选择方法
  • 4.3.3 实验结果分析
  • 4.4 小结
  • 第五章 基于单值分类的信用卡欺诈检测模型研究
  • 5.1 信用卡欺诈风险检测模型
  • 5.2 数据预处理
  • 5.2.1 数据预处理概述
  • 5.2.2 信用卡交易数据预处理
  • 5.3 欺诈检测模型的建立
  • 5.3.1 模型建立模块
  • 5.3.2 欺诈交易检测模块
  • 5.4 实验结果对比及评价
  • 5.4.1 检测性能的评估指标
  • 5.4.2 实验结果对比与评价
  • 5.5 小结
  • 第六章 总结与展望
  • 6.1 工作总结
  • 6.2 进一步工作
  • 致谢
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 相关论文文献

    • [1].基于本质特征和网络特征的信用卡欺诈检测[J]. 微型电脑应用 2016(12)
    • [2].不均衡数据情况下信用卡欺诈识别[J]. 通讯世界 2018(12)
    • [3].基于特征工程的信用卡欺诈检测策略研究[J]. 现代电子技术 2019(15)
    • [4].我国商业银行信用卡欺诈风险分析与防范[J]. 企业家天地(理论版) 2011(06)
    • [5].信用卡欺诈行为识别中的机器学习方法:比较研究[J]. 中国高新科技 2018(24)
    • [6].信用卡欺诈风险防范需合力[J]. 金融博览 2013(05)
    • [7].基于支持向量机的信用卡欺诈检测[J]. 计算机仿真 2011(08)
    • [8].信用卡欺诈的成因及对策分析[J]. 现代营销(学苑版) 2012(05)
    • [9].信用卡欺诈犯罪预防的思考[J]. 中国审判 2008(04)
    • [10].信用卡欺诈风险的防控[J]. 国际金融 2012(11)
    • [11].基于相似系数和的信用卡欺诈检测模型研究[J]. 网友世界 2013(10)
    • [12].信用卡欺诈风险的类别[J]. 中国外资 2011(02)
    • [13].信用卡上的攻防博弈[J]. 金融电子化 2018(06)
    • [14].互联网时代的信用卡欺诈风险管理浅析[J]. 中国信用卡 2017(04)
    • [15].骗局旧貌换新颜专家教你躲开信用卡欺诈陷阱[J]. 广西质量监督导报 2017(02)
    • [16].进化神经网络在信用卡欺诈检测中的应用[J]. 微电子学与计算机 2011(10)
    • [17].利用信用卡欺诈检测时间序列及时挖掘信息[J]. 中国证券期货 2012(12)
    • [18].基于Neo4j图谱的信用卡欺诈检测[J]. 信息与电脑(理论版) 2018(21)
    • [19].信用卡欺诈申请的现状、成因及防控措施[J]. 中国信用卡 2010(12)
    • [20].互联网金融背景下银行信用卡欺诈与套现风险防控研究[J]. 时代金融 2019(11)
    • [21].基于支持向量机的信用卡欺诈检测[J]. 微计算机信息 2010(06)
    • [22].诺顿分享网购安全经验,帮助避免安全风险[J]. 计算机安全 2012(12)
    • [23].基于多层架构的信用卡反欺诈系统研究[J]. 金融科技时代 2018(01)
    • [24].防盗刷,这些招咱得会[J]. 晚霞 2016(18)
    • [25].奥运期间有组织犯罪的活动方式和防控措施[J]. 江苏警官学院学报 2008(04)
    • [26].基于GAN-AdaBoost-DT不平衡分类算法的信用卡欺诈分类[J]. 计算机应用 2019(02)
    • [27].哪种支付方式最安全?[J]. 中国合作经济 2011(04)
    • [28].民生信用卡手机支付开启无卡生活[J]. 中国金融家 2016(04)
    • [29].大数据应用和全流程防控为信用卡风险管理护航[J]. 中国信用卡 2016(06)
    • [30].我国信用卡产业风险管理的对策建议[J]. 中国证券期货 2013(02)

    标签:;  ;  ;  ;  ;  ;  

    SVDD算法研究及在信用卡欺诈检测中的应用
    下载Doc文档

    猜你喜欢