论文摘要
人工免疫系统研究旨在抽取生物免疫系统中独特的信息处理机制,研究和设计相应的模型和算法,进而应用与解决各种复杂问题。人工免疫作为计算智能领域的研究热点,已经在信息安全、模式识别、智能优化、自动控制、数据挖掘等诸多领域得到了应用,体现了强大的信息处理和问题求解能力。本文重点研究了一种基于人工免疫系统的分类算法,并将其应用到电信行业的客户流失分析中。所做工作归纳如下:对人工免疫系统理论及人工免疫系统生物学基础做了概括和分析,综述了国内外的几种典型的人工免疫算法。对国内外电信流失分析研究做了概括和分析,综述了几种传统的数据挖掘分类算法。目前决策树、神经网络等算法都要采用过量抽样才能进行挖掘,而贝叶斯算法不能产生容易理解的规则。针对IFRAIS(Induction of Fuzzy Rules with an Artificial Immune System)算法在克隆选择过程中容易陷入局部最优的弱点,在原来克隆选择过程中增加了抗体与抗原的交叉,并改变了抗体的变异模式,提出了抗体抗原交叉的规则归纳算法(Induction of Rule with Antibody-Cross-Antigen of Artificial Immune System, IRAA)。同时也分析了变异概率对IRAA算法分类性能的影响,还对IRAA算法的样本分类过程进行了讨论。实验结果表明,IRAA算法是一种性能较高的分类算法。提出了一种基于x2统计的属性相关性的属性约简算法,该算法不但能过滤掉属性集中的无关属性,而且能有效地找到属性集中的冗余属性,并对其算法复杂度进行了分析。以IRAA算法为基础,结合属性约简新算法,数据挖掘过程为线索,构建了电信客户流失预测模型。在该模型下对IRAA、IFRAIS和传统分类算法进行比较实验,结果表明,这些改进有效地提高了算法性能,而且基于人工免疫系统的分类方法在挖掘过程中具有不需要过量抽取数据和产生容易理解的规则的特点,在其他行业业务系统中将有广泛的应用前景。