(中国南方电网有限责任公司)
摘要:随着一体化信息系统的初步实现,如何利用对海量客户及营销数据的挖掘为营销管理及客户服务工作提供决策支持是当前电网企业思考的重点。数据挖掘作为一种数据处理技术,借助其自身的优势,可以从大量的不完整信息中挖掘出潜在的、有价值的信息,进而更好的为电力营销服务。对此,本文首先对数据挖掘技术的特点进行介绍,然后就当前电力营销部门中常用的数据挖掘算法进行分析,旨在对当前数据挖掘算法在电力营销中的应用进行全面梳理,为其应用提供借鉴。
关键词:数据挖掘;电力营销;应用
随着现代电力企业改革的深入推进,借助信息化技术不断提升企业的管理水平,是当前电力企业工作创新的一个重要趋势。其中,电力营销系统作为电力企业的核心组成部分,在业务方面其涵盖了不同的业务,如业扩报装、电费抄核收、电能计量、线损管理等方方面面,在客户服务方面又涵盖了客户中心服务及电子化渠道服务等等。因此如何加强对其中数据的利用,并借助现代信息手段对其中的数据进行分析,是提升电力企业服务水平,提高电力工作效率的一个重要途径和方式。对此,本文则从提高营销系统数据利用的角度,就如何用好当前营销系统的数据进行深入的探讨和研究。
1数据挖掘概述
数据挖掘作为一种专门用于对数据进行挖掘的技术,随着互联网时代下数据的积累,开始被大量的应用在各个不同的领域,如生物、医学、制造等等。通过数据挖掘,不仅可以发现数据中潜在的信息,同时还可以借助挖掘手段,更好的为企业营销服务。数据挖掘的概念最早是从机器学习概念中衍生而来。研究认为,数据挖掘是一种从例子中对数据规律进行分析的方法,并且这种方法是介于无指导和较少使用归纳的一种方式。因此,从某种角度来讲,数据挖掘出自机器学习,但是与机器学习相比,机器学习更注重的是如何提高机器自身的学习能力,而对于数据挖掘来讲,则是更关心如何在海量的数据中找到更加有价值的信息。因此,两者之间即有着联系,同时又有着区别。其中机器学习更多的注重与少量的数据,而对于数据挖掘来讲,则更加倾向于海量的数据。当前,主流的数据挖掘算法很多,如回归算法、聚类算法、预测算法以及关联规则算法等等。
2数据挖掘在营销管理系统中的应用
2.1电力营销系统数据特点
对电力营销系统来讲,其数据涵盖了多个方面,包括工作单数据、客户档案数据、量测数据、电量电费数据、收费数据、计量资产全寿命周期数据等等。由此通过上述的组成我们可以看出,营销管理系统设计的数据的范围比较广,同时涉及到的不同类型的数据。因此,在对电力营销数据进行挖掘的过程中,首先要对数据进行预处理,然后在清洗后再对数据进行挖掘。
2.2主要数据挖掘算法的应用
目前,针对数据挖掘技术在电力营销中的应用中,主要包括客户电费回收风险群体划分、负荷预测等。
2.2.1客户电费回收风险细分模型
电网企业的主要经营利润来自于电费回收。通过分析不同客户的缴交电费的行为以及客户基本属性特征,进行客户的电费回收风险预测,有利于对不同客户提前采取差异化的电费回收策略和预防措施,保障企业的电费收入,有效控制企业经营风险。
同时,加强对电费回收的实时监控;加强银企合作,加快电费资金归集速度;全面推广客户信用评价机制,建立基于客户信用的电费回收策略,防范电费回收风险。通过明确每个客户的电费回收风险等级,寻找出电费回收风险高的客户,制定差异化服务策略,制定行之有效的电费回收风险预防手段,加强风险管控。已经成了有效预防恶性欠费事件的发生,提高电费回收效率的重要手段。
如何形成统一而有效的界定标准,来甄别这一部分客户,主要思想为提取营销系统里的与电费回收相关的各字段信息,运用算法模型,预测客户的电费回收风险,并在系统中为客户进行标识。主要包括以下步骤:
第一,电费回收风险是对用户未来按期缴费行为的提前预测,希望通过差异化提醒和账单等方式,提高电费回收率指标。因此需要采用预测模型,在此选择逻辑回归模型。
第二,逻辑回归模型是一种经典的分类算法,该模型可以根据一组自变量输入计算出归属每种类别的概率,一般常用的是二项逻辑回归(二分类),即类别只有两种:0和1。通过设定阈值(是否发生违规用电)将用户进行分类。
第三,模型参数选择,模型参数分为居民和非居民分别进行建模,虽然个别参数不同,但大部分一样,主要模型参数包括客户年龄,负荷类型,用电性质,当前是否销户,合同容量,客户身份,供电电压,出账周期,合同容量,总用电量,平均缴费时长,金额,违章用电次数,罚金金额,账单登录次数,缴费方式变更次数等。
第四,根据平均值、中位数划分坏客户,当划分金额存在偏大或偏小的情况时,会出现和供电局实际情况不符,因此可以选择给出75分位或者其他分位的划分标准的。最终按用户号将预测变量(基本属性及历史行为属性)和目标变量(是否为坏客户)进行拼接,用于建模。
第五,逻辑回归模型对预测的结果进行随机抽取样本数据进行比较和校验,按照4:3:3的比例对数据进行训练、验证、测试。
2.2.2电力大数据负荷预测
近几年来,由于经济结构调整,我国用电市场出现了缓和,电力设备出现了部分闲置,发电机组平均运行小时逐年下降,直接影响电力企业的经济效益。特别是厂网分开,采取合约电量+竞价上网模式运作,各类用户构成的各种各类负荷,分别呈现出不同的特性和大小。由于电能不能大量存储,要求发电功率时时刻刻跟踪负荷变化,做到供需平衡。
由于负荷预测是根据电力负荷的过去和现在推测它的未来数值,所以,负荷预测研究的对象不是确定事件。只有不确定事件、随机事件,才需要人们采取适当的预测技术,推知负荷的发展趋势和可能达到的状况。电力负荷未来的发展是不确定的,它要受到多种多样复杂因素的影响,我们很难把握这些因素在未来某一时刻的状态,只能在一定条件下,进行一定简化并做出若干假设得到预测结果。通常需要做出多种假设和简化,选用不同的预测方法,所以负荷预测具有不确定性、多条件性和多方案性的特点。
虽然负荷预测有以上特点,但是负荷预测也是有一定的规律,通过对历史数据的分析,找出其内在规律,按照一定的科学原理,可以保证负荷预测工作尽可能地接近实际情况,尤其中长期负荷预测存在如下的普遍规律:首先电力负荷的发展是有一定规律的,这是进行预测的基础;其次,电力负荷的发展是一个连续统一的过程,其未来发展是这个过程的连续;再次,各地区、各年段电力负荷的发展具有一定的可比性、相似性;最后,电力工业的发展与整个社会有着直接的联系,通过分析国民经济发展水平和趋势,可以对电力负荷的发展做出相应的估计。具体如下:
第一,研究国民经济的各项指标对负荷需求的影响,考虑土地面积和气候的影响,考虑未来重大项目建设对当地负荷的影响。
第二,建立预测模型方法库。预测实践表明:任何一种方法只是数学上的一种理想的模型,只能对某一种负荷的发展规律有较好的拟合和预测效果。不同地区、时间、行业的负荷变化规律是不同的,很难用一种或几种预测模型描述所有的负荷变化规律,必须建立负荷预测的方法库,以尽可能多的预测模型满足负荷发展规律多样性的需求;
第三,提出最先进的预测策略。其实质是研究如何将各种预测方法的预测结果进行最佳的组合,包含了几方面的内容:
1)灰色系统理论建模过程简单,预测精度高,已经成为预测领域一个非常重要的预测方法。它具有建模所需信息较少、建模精度较高等特点。
2)神经网络进行负荷预测是近十年兴起的预测方法,其优点是可以模仿人脑的智能化处理,对大量非线性、非精确性规律具有自适应功能。
3)时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法)进行。
第四,预测模型的自适应特色。根据预测对象及其相关历史数据的特性自动筛选适合的方法模型;同时,在跟踪记忆用户的预测过程时,通过方法的选择和误差分析可以得出适合预测对象的最优综合模型,从而进一步提高系统的便捷程度和模型预测精度
第五,提供预测结果评估系统。对于不同的预测结果可以通过系统自动评估出结果的精确级别,并推荐出三到四个预测结果让用户选择,缩小决策的选择范围。
3数据挖掘在电力营销的应用前景
通过上述的研究可以看出,随着现代信息化技术的不断进步,电力企业中对数据挖掘的应用还将逐步扩大。而除上述的挖掘算法以外,深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。而在电力企业的信息化进程中,特别是在营销管理系统中,任何算法并不是单一存在的,而是多种算法结合对数据进行挖掘,进而通过这种挖掘为电力决策部门提供全方位、多角度的数据分析和预测。另外,随着电力营销的不断推进,基于大数据的数据挖掘以及深度学习将成为一种新的发展趋势和方向,并逐步提高电力企业数据分析的效率。
参考文献
[1]段力伟,彭其渊,汤银英,李冰.基于LC-HB模型的铁路货运客户选择偏好差异性与市场细分方法[J].铁道学报,2015,37(01):1-6.
[2]王继业,季知祥,史梦洁,黄复鹏,朱朝阳,张东霞.智能配用电大数据需求分析与应用研究[J].中国电机工程学报,2015,35(08):1829-1836.
[3]宋才华,王永才,蓝源娟,郑锦卿.基于数据挖掘的电力行业客户细分模型分析[J].现代电子技术,2014,37(14):21-23+27.
[4]戴小廷,陈荣思,肖冰.基于信息熵的决策树挖掘算法在智能电力营销中的应用[J].郑州轻工业学院学报(自然科学版),2012,27(03):49-52.