(国网忻州供电公司山西省忻州034000)
摘要:智能电网的信息化需求对电网线损管理提出更加精细化的要求,有必要改变线损粗放管理模式。电网线损率是反映供电企业生产技术和经营管理水平的一项综合性技术经济指标。
关键词:线损;数据治理;检测;
数据治理技术在线损数据管理中的应用,提出一套电力企业数据质量治理模型。采用唯一性治理、完整性治理和准确性治理等方法来保证线损数据质量,同时运用实际数据进行模拟仿真实验,以验证线损数据质量治理技术的可靠性,并分析了模型的稳定性。通过线损数据质量治理,能够满足电力企业的线损数据使用需求,促进电力业务的稳步发展。
一、概述
电力产业是国民经济的基础性产业,其中电网线损体现着电力企业的经济性能以及管理水平。实现线损的降低是电力传输、营运部门在节约能源、增大能效中的重要任务之一,这也成为了相关电力企业在激烈的竞争中赖以生存和发展的必要因素。随着电力企业线损系统建设的不断完善,诸多线损数据质量问题逐渐显现出来。采集的数据存在着数据缺失、脏数据及不统一等问题。线损数据质量不达标会严重影响进一步数据分析结果,所以迫切需要建立线损数据质量治理制度,来改善线损数据质量偏低的情况。保证线损数据根据同一标准进行一致性处理,从而在数据与平台之间传输、处理、分析时不会发生错误,以应对更广泛的数据应用需求。数据治理仍然是当今业界的焦点话题之一,与相关企业对采集数据的形式、数据质量的理解、数据治理方式的选择等密切相关。我国学者对于线损的处理已经有了较深入的研究,并提出了“四分”线损管理办法,但是其处理的数据量较少,在分析智能电网时代带来的海量线损数据时存在着明显不足。由于现在的电网中还未普及智能化电力设备,所以采集的线损数据存在着数据不完整、脏数据等问题,根据这些数据不能实现有价值的分析,在此情况下,对现有的数据进行质量治理,使数据更完整、准确、可靠,为线损的分析提供可靠的数据支持。针对智能电网环境下对高质量数据的需求展开了讨论,提出电网中采集的数据有质量问题,并对提升其质量的原理进行了分析,提出了改进其质量的方法。提出了在电力大数据时代,对电力数据质量具有影响的因素,并提出了相应的治理方法,
二、电网线损数据质量治理技术
1.数据质量。数据质量指的是人们在利用数据进行分析的时候,数据的分析结果是否能够体现出所要分析对象的特征,能够获得用户想要的目标结果。数据质量是从用户使用的层面看待问题,基于具体的用户感知度,所以在数据分析领域被广泛使用。数据的固有质量包括数据的完整性、准确性以及一致性等特点。在利用数据的时候,在数据的采集、提取以及传递的时候,会对数据的固有质量产生影响,称其为过程质量。通过对数据的采集、处理、分析等,用户获得期望的分析效果,同时根据结果也可以对数据质量进行验证。一般情况下,对数据的质量认定首先是对数据包含的属性是否全面、准确进行辨别。针对数据的质量问题,根据数据包含的属性,对其进行维度分析,如图1所示。
图1数据质量维度图
2.电网线损数据质量治理。数据治理的流程内容包括了用户端、后端以及采集源的数据,从数据的采集源开始到用户使用端,然后再从用户端反馈到采集点。通过这样的数据治理方式,实现电力数据的校正、核对、是否丢失等处理。对电网的数据质量来说,与当前电网的运行状况和电力环境息息相关,并且在不同电力时代,对数据质量的要求也不一样。线损数据治理后的数据,对于工作人员分析电网的能耗,电力系统运行状况,做出相关决策都具有重要的意义。所以,有效地对线损数据进行分析治理,提高数据质量,十分必要。对线损数据进行治理,获得期望得到的线损数据,利用数据信息可以实现对目标信息的预测与分析,为构建电力智能决策系统,实现现代化智能电力系统提供了基础保障。良好的数据质量是工作人员制定全面的智能化服务及决策的基础。对于线损数据的治理既要从技术上进行提升,将数据治理具有好的质量,又要使处理后的数据能够满足工作人员的使用。
3.电网线损数据质量治理技术研究。目前的电力系统中,线损源头数据在各专业系统中存在多头建档情况,业务间横向贯通不彻底,信息整合的困难较大,在电网数据整合的过程中,可能面临着冗余数据、缺失数据、无效数据、错误数据等问题,运用何种方法解决这些问题对提高系统的效率,加强最终效果的可信度具有极其重要的意义。(1)数据的唯一性治理。由于普及智能电表需要一定过程,所以电力企业线损数据来源除了智能电表自动采集外,还有部分采取人工录入方式,在数据录入时可能会存在数据重复现象。针对这一现象,从两个方面进行治理。一是通过数据库进行操作,对采集上来的数据进行唯一性约束设定。从采集方面,采用人工录入方式时,逐个数据进行唯一性检查。如果是自动采集,则在采集完成后再进行唯一性检测。(2)数据的完整性治理。采集到系统的数据信息如果存在属性不全则称为数据不完整。检查数据包含的属性是否完整,并对应不同的缺失类型以及数据量大小采取不同的处理方法。其中线损数据缺失属于完全随机缺失,采取多重插补技术和完全信息极大似然估计模型来解决不同数据量下的线损数据缺失问题。1)数据集相对较小但采取人工补录较为麻烦时,通常需要对缺失数据进行插补处理,改变了传统方法将缺失值忽略不考虑的习惯。采用多重插补对线损数据缺失问题进行处理。多重插补是从单一插补基础上衍生来的,针对单一插补存在扭曲样本分布的缺点进行改进。多重插补是把不完整的属性用数值补上,并对数据进行处理。2)当数据量较大的时候,运用多重插补技术修复缺失数据会增加不必要的计算负担,从而影响治理速率,所以在处理海量数据时采用完全信息极大似然估计模型来处理数据缺失问题。完全信息极大似然估计认为采集的数据呈正态分布,采用此方法对电力线损数据进行处理,对数据属性的不完整信息进行估计,提高线损数据质量。(3)数据的准确性治理。数据的准确性治理主要是找出数据源中记录字段的值与实际值不相符的异常数据,并将其剔除或是修改。采集的数据中存在着与其他数据信息不一致的情况,称其为孤立点。该文采取孤立点检测法对错误数据进行清除。孤立点的产生可能是设置的标准有误,或是转换时数据变异。查找出数据中存在的孤立点并进行删除,可以提高数据质量。由于线损数据为离散型数据,所以应采用针对离散型数据的孤立点检测法。检测离散型变量中的孤立点是根据数值出现的频率来判定的。采用字段值的一致性与否来判断数据是否为孤立点。表达式为:
(1)
式中:r是形状因子,表示对一致性的看法。由式(1)看出,当某个字段监测到的次数远小于记录的平均值时,一致性接近0。当Di接近0时,μR近似为1,说明某个数据出现一次,不认为其是孤立点。对Ai计算μR(Vij),定义一个α,如果μR(Vij)<α,认为该值是孤立点。检测的孤立点写成集合{Vij:μR(Vij)<α}。运用孤立点检测法,从数据源中找到异常数据,因为异常数据为少部分,可以选择人工排查或者直接剔除的方法做到线损数据的准确性治理,从而有效提高线损数据的数据质量。
总之,提出的电网线损数据治理方法具有可靠性及高准确率,提高了电力企业线损数据的质量,进而提升电力企业数据管理及应用水平。
参考文献:
[1]余风,电力网技术线损分析及降损对策.2017.
[2]杨珍萍.浅谈电网线损数据质量治理技术研究.2017.