基于大数据挖掘技术的电能表性能分析方法的探讨曾毅

基于大数据挖掘技术的电能表性能分析方法的探讨曾毅

(河源供电局)

摘要:电能表的质量检定关系到电力用户以及供电企业的实际利益,具有重要的意义。面对传统电能表质量检定中的弊端以及电力系统日益积累的海量数据,我国供电企业迫切需求利用大数据挖掘技术来进一步完善电能表性能检定工作。本文从大数据挖掘技术的特征和数据挖掘过程入手,首先对大数据挖掘技术进行探讨,在此基础上提出一套基于大数据挖掘技术的电能表性能分析系统,并从功能需求、整体架构以及实现方案等方面,对此系统进行了全面的阐述,以期能够帮助我国供电企业改善电能表性能检定的情况。

关键词:大数据;数据挖掘;智能电表

当前我国智能电能表的应用已经相当普及,对供电企业以及广大的电力用户群体而言,智能电表的质量检定事关各自实际利益。若智能电表质量出现问题而造成计量偏差,会对我国社会产生较严重的影响。就目前来看,我国智能电表质量检测的相关规程及技术规范,都缺乏整体宏观的数据统计分析管理,采取对单只电能表进行检定的方式。其弊端主要反映为:达不到政府监管部门的要求,达不到计量资产全寿命周期管理及检定质量管控的要求,也无法综合评价智能电表供应商的整体产品质量。这些弊端可能会造成广大电能用户群体的质疑,同时也局限了我国供电企业的决策依据。在此背景下,我国供电企业迫切需要推进大数据挖掘技术应用的步伐。

一、大数据挖掘技术概述

所谓的大数据挖掘是指对数据库的海量数据进行筛选识别,提取其中的有效、有潜在价值的模式,最终提取出以概念、规律等形式表现的知识,这整个过程即数据挖掘。数据挖掘的具体过程为数据准备-数据选择-数据预处理-数据缩减-确认目标-确认算法-数据挖掘-模式结束-知识评价,可以将其总结为数据准备、数据挖掘以及知识评估这三个阶段,在进行数据挖掘时会反复执行这三个阶段。数据挖掘过程的模型如图1所示:

图1数据挖掘过程

就目前而言,数据挖掘的方法较多,其中常见的方法有分类、聚类、关联规则、回归等。根据数据挖掘方法的差异,各种不同的算法随之衍生而来。如决策树、贝叶斯、神经网络等便是基于分类法的算法,而Bagging、Boosting等则是用于组合型方法的混合算法。

从整体来说,电力系统所涉及的大数据具有著名的“4V”特征,即海量规模(volume)、多样类型(variety)、高速变化(velocity)、价值(value)。大数据处理的生命周期包括数据采集-数据存储-分析处理-展示等四个阶段,其中的关键是数据存储与数据分析处理。我国电力系统规模庞大,在其运行过程中会不断产生数据,实行省级集中检定电能表后,电能计量自动化检定平台更是积累了海量数据。我国电力企业一直在探索对这些海量数据进行处理分析并提取有价值信息的有效方法,并取得一定进展。目前已经将大数据挖掘技术应用于企业管理、营销决策支持、故障诊断及预警、电能表运行状态分析等方面,充分提取海量数据的价值,为各项工作提供数据支撑,有效降低了电能表质量风险。

二、基于大数据挖掘的电能表性能分析系统构建

针对目前我国对单只电能表进行检定的方式存在诸多弊端的情况,本文提出一种基于大数据技术的电能表性能分析方法,通过构建系统的方式对电能表进行分析。

2.1系统功能需求

电能表运行信息的来源包括用电信息采集系统、计量生产调度平台以及营销业务系统,如表1所示。

该系统能够通过检定合格率及不合格项目的数据统计分析,根据合格率对电能表供货商进行排名,并且关联分析不合格原因,找出问题根源;

该系统能够通过误差数量、负误差数量、零误差的数量及概率统计分析,得出误差极值、正负误差平均值,并且评估各电能表供货商误差分布;

该系统能够通过输入查询条件,能够将对应的数据统计分析结果以报表等形式输出。

2.2系统总体架构设计

本文提出的基于大数据技术的电能表性能分析系统,其总体架构如图2所示。

由图2可以看到,该系统分为:数据采集层、数据存储层、数据计算与分析层以及展示层。

(1)数据采集层的功能有数据抽取、数据分发以及日志文件抓取等。数据采集层从数据来源(用电信息采集系统、营销业务应用系统、计量生产调度平台等)采集设备档案、负荷与电量、通信日志等信息,并且进行数据清理、数据校验和数据处理。

(2)数据存储层由分布式数据,数据仓库,关系型数据库等多种数据库组合构成,通过对该层设定相关规则,能够将海量数据根据类型、访问需求等进行筛选,并且分别存储到不同的文件系统中,从而为数据计算与分析层提供数据支持。

(3)数据计算与分析层包括了批计算、库内分析、数据挖掘等模块,能够支持结构化、半结构和非结构的数据统计计算,从而满足快速、高效地分析各种类型数据的需求。

(4)展示层为电能表性能分析系统的用户提供可视化平台,能够显示大数据分析结果,并且可以向外部系统发布或推送。

3系统实现具体流程

结合系统开发的相关技术,本文将该系统实现流程设计为如图3所示。

如图3所示,本文所提的电能表性能分析系统,通过数据采集系统对数据源信息进行采集,由分布式数据总线将数据传送至数据存储层的分布式数据库HDFS中进行储存,在数据计算与分析层中采用MapReduce并行计算对数据进行预处理以及数据转换,再通过数据挖掘工具进行数据挖掘与分析。先采用贝叶斯分类算法对数据进行分析,抽取检定检测记录、计量故障换表、现场校表等信息,然后结合聚类算法以及回归算法进行数据分析,得出整体分析结果,将分析结果展现与调优后得到电能表性能的判断报告。

图3系统实现具体流程

三、结语

综上,针对目前我国对单只电能表进行检定的方式存在诸多弊端的情况,本文提出了基于大数据挖掘技术的电能表性能分析系统。该系统对营销业务应用系统、计量生产调度平台等数据来源进行数据抽取采集,由分布式数据库HDFS进行存储,通过综合使用贝叶斯算法等不同算法,对数据进行挖掘并得出整体分析结果,通过该系统显示层发布电能表性能判断报告。供电企业能够以该报告为参考依据,来制定现场校表和制定轮换计划。

参考文献

[1]王继业,马士聪,仝杰,祝恩国,何桂雄,马晓静.中日韩电网关键技术发展及趋势分析[J].电网技术,2016,40(02):491-499.

[2]王桂兰,周国亮,赵洪山,米增强.大规模用电数据流的快速聚类和异常检测技术[J].电力系统自动化,2016,40(24):27-33.

[3]李珏,马晓东,张果谋,吴少雄,王军.大数据分析在用电采集数据分析与智能监测系统的设计与实现[J].电气应用,2015,34(S1):558-561.

标签:;  ;  ;  

基于大数据挖掘技术的电能表性能分析方法的探讨曾毅
下载Doc文档

猜你喜欢