大数据分析技术在采集运维业务中的应用研究

大数据分析技术在采集运维业务中的应用研究

(国网辽宁省电力有限公司抚顺供电公司辽宁省抚顺市113006)

摘要:目前,我国对用电信息系统的建设和发展已经逐渐完善,累积接入的采集终端约有1500万台,智能电表的接入约5亿。为了确保在用电信息采集系统中各项业务顺利展开,就需要加强对采集系统的运行维护工作,这也是采集系统未来主要研究和注意的问题。从当前情况来看,在采集运维业务中还存在着诸多问题,如运维效率较低,缺乏故障优先处理级,故障种类多样、复杂,难以对故障进行准确的定位等,因此本文就首先对用电信息采集系统的运维业务中所存在的问题加以分析,并进一步提出在采集运维业务中大数据分析技术的应用。

关键词:大数据分析;技术;采集运维;业务;应用;分析

引言:用电信息采集系统建设已经接近尾声,目前累计接入智能电能表4.2亿只、采集终端1263.84万台,覆盖用户3.86亿户,因此,如何保证采集系统中各项业务的顺利开展,将是今后要解决的主要问题。采集运维业务中主要存在如下问题。缺乏故障处理优先级,运维效率低下。各省电力公司平均每天产生10000条异常工单,远远超过目前配备运维人员的工作能力。大部分公司没有制定合理的消缺机制,无法依据故障的紧急程度和重要等级开展运维业务。故障种类复杂多样,故障分析定位困难。用电信息采集系统涉及的运维对象有:智能电能表、采集终端、采集主站、本地通信信道和远程通信信道。目前统计的异常现象共七大类59种,故障原因98种。故障分析定位非常困难,普通的运维人员通常不具备定位故障原因并确定消缺方案的技术能力。

1.用电信息采集系统运维业务存在的问题

1.1用电采集系统运维效率低

随着社会经济发展水平的提升,在人们日常生活和工业生产中对电力需求量在逐渐增加,电力行业也得到了快速发展,但根据调查统计发现,电力公司每日产生的异常工单总计约有1万条,工作强度远远超出运维工作人员的工作能力,且大部分企业都没有建立消缺机制,在故障处理和运维业务开展中难以根据业务的紧急程度开展相应等级的工作,从而导致采集系统的运维效率低下。

1.2对故障点难以进行准确的定位

在电力企业的用电信息采集系统的运维业务工作开展中,主要的运维对象为采集主站、智能电表、远程通信信道、本地通信信道、采集终端。根据统计发现异常现象的种类可以分为59种,根据不同的故障原因又可以将其分为100种,故障的种类十分复杂、繁多,导致难以对故障点及故障原因进行准确的定位和分析,普通的运维工作人员也难以对故障原因进行定位,缺乏消缺方案技术能力。

2.大数据分析关键技术

大数据在采集系统中的应用包括数据采集、数据清理、数据存储、数据分析、数据处理、数据解读和数据应用6个环节,本文针对数据分析环节中,引入关系型联机分析处理机制和多维分析技术进而优化整个系统进行论述。一是关系型联机分析处理(RelationalOnlineAnalyticalProcessing,ROLAP)。关系型联机分析处理是联机分析处理(OLAP)的一种形式。这种技术基于关系型数据库,以关系型结构进行多维数据的表示和存储,对存储在关系数据库(而非多维数据库)中的数据作动态多维分析。使用关系数据库管理系统(RelationalDatabaseManagementSystem,RDBMS)存储数据,数据文件大小受RDBMS限制;数据装载速度快;存储空间耗费小;维度数没有限制;可以通过SQL对数据进行处理。二是多维联机分析处理(MultidimensionalOn-LineAnalyticalProcessing,MOLAP)。多维联机分析处理是OLAP的另一种形式,基于专门的多维分析数据存储结构。MOLAP使用专有多维结构存储数据,数据文件大小可能受到操作系统平台文件大小限制,难以达到TB级;规划存储时需要对数据量进行预测算,否则可能导致数据爆炸;数据装载速度慢;维数有限,无法支持维的动态变化;缺乏数据模型和数据访问的标准;分析查询响应速度高于其他传统OLAP技术,支持高性能的辅助决策计算。

3.大数据系统的采集运维业务优化

3.1异常工单智能派发

当前在异常工单派发中主要是由采集运维工作人员负责,但在人工派发工单的情况下难以对现场情况紧急程度进行合理的判断,并在异常工单大量产生时不能按照先后顺序对工单进行合理的消缺,对于需要紧急处理的故障难以在最短时间内进行修复,造成大量经济损失。本文就从多维分析的角度对大量的运维数据和系统的历史数据进行分析,对不同种类异常工单的严重程度进行判断,提高异常工单的处理效率和处理质量,提高采集系统设备的数据完整性。

一是采集运维效用值模型。在单个表计效用值的情况下,主要受到月平均用电量、异常持续时间和离下一抄表天数的影响,而总体的工单效用则是指工单的故障电表效益总和,也就是指故障电能表数量的影响,而根据这些因素可以得出效用值的模型公式,即Y效用值=Σf(x),其中Y效用值指的是采集运维业务的效用值,而f(x)则表示的是单个电表的异常采集运维效用值,i表示的是第i个电能表。

二是模型应用。在对采集异常运维数据的分析和处理中主要是对月平均用电量、异常持续时间和离下一抄表天数的分析,其中月平均用电量仅仅将使用电量作为效用值时,最后计算的数值较大,将标准月用电量引入到整体模型中去作为最后的数值单位,标准用电量是在随机抽取大部分用户实际用电量,并统计出各类用户月平均用电量,根据最多类型的用户平均用电量作为标准用电量。居民月均用电量和非居民月均用电量的分界点为≤200kW•h的为一户标准户,≤1000kW•h,>200kW•h的为2户标准户,>1000kW•h的为3户标准户。异常持续时间指的是每个电表故障持续一天则会造成一天的电量监控损失,电量的监控损失按照累加的方式进行计算。距离下一抄表天数的分析,当距离效益抄表的天数越近,则表明对该用户的监控损失电量概率越大,故障的紧急维修程度越高;当距离效益抄表的天数越远,则表明对该用户的监控损失电量概率小,且该因数所造成的影响趋近于0。

3.2异常工单的智能化处理

原有的采集运维业务开展主要是由于缺乏大数据支撑,当运维人员对该地区缺乏一定的熟悉程度的情况下,运维工作的效率较低,对已发生的故障缺乏准确的分析能力,运维人员只能对现场故障类型进行一一排查。在对异常工单的历史大数据中采用大数据分析技术,可以通过系统异常分析功能对现场的故障类型进行快速判断,提高现场的运维效率。对于新生成的异常工单,可以通过生产厂家、国网招标批次、故障设备类型等维度对异常原因的发生概率进行判断,从而确定异常工单的主要原因,并对比值大小进行比较预测出异常原因,从多维度分析角度对异常原因的分析概率比值公式为Y比值=Σf(xi)/n,其中Y比值指的是单个异常原因的概率比值,而f(xi)则表示的是单个维度下单一异常原因的发生概率,n表示所有维度总量。

总结:在用电信息采集系统中的运维业务中采用大数据分析技术,可以对采集的数据信息进行深入挖掘和分析、处理,对运维异常工单进行智能化派发和分析处理等,使采集运维工作从粗放式管理逐渐向集约式和精益化方向发生转变,提高运维业务水平和工作效率。

参考文献:

[1]吴文峻.面向智慧教育的学习大数据分析技术[J].电化教育研究,2017,38(06):88-94.

[2]袁红,朱睿琪.用户信息搜索行为大数据分析框架及其关键技术[J].图书馆学研究,2016(24):39-46.

[3]胡水晶.基于资源基础观的企业大数据分析技术采用意愿影响因素研究[J].情报科学,2016,34(05):148-152.

[4]张春丽,成彧.大数据分析技术及其在医药领域中的应用[J].标记免疫分析与临床,2016,23(03):327-333.

[5]张滨.大数据分析技术在安全领域的应用[J].电信工程技术与标准化,2015,28(12):1-5.

[6]高洪,杨庆平,黄震江.基于Hadoop平台的大数据分析关键技术标准化探讨[J].信息技术与标准化,2013(05):27-30.

标签:;  ;  ;  

大数据分析技术在采集运维业务中的应用研究
下载Doc文档

猜你喜欢