浅谈大数据时代数据挖掘技术在电力企业中的应用

浅谈大数据时代数据挖掘技术在电力企业中的应用

(新疆乌鲁木齐市国网新疆电力有限公司电力科学研究院新疆乌鲁木齐市830011)

摘要:当前我国已经进入大数据时代,在这一背景下,电力企业的发展脚步在不断加快,发展的同时必然会产生海量的数据和相关参数,其中大部分数据都是很有价值的。所以,处在数据时代的电力企业如果想促进自身的快速发展,就要对这些数据和参数进行归纳和统筹。本文就对大数据的含义进行分析,同时讨论了在大数据时代电力企业所面临的挑战,并且对电力大数据时代下数据挖掘技术进行了探讨,以供参考。

关键词:大数据时代;数据挖掘技术;电力企业

引言

在电力企业的发展过程中,对于如此多的数据,如何利用现有的手段和技术水平,从中发掘出数据的潜在价值,进而为电力企业改进决策、降低成本、提高收益提供依据,这已经在电力系统中引起了越来越多的人的关注。因此,在大数据的趋势下,电力企业如何发掘数据的潜在价值就显得尤为重要。

1简述大数据时代

1.1大数据含义

大数据不同于传统的数据库,其具有种类多、流量大、容量大、价值高的特性,这些特性主要是从大数据“大”的方面进行阐述的,概括起来就是从大内容以及大分析的角度来表现大数据的特性。从传统的数据库时代到大数据时代,数据的处理方式如果仅仅依靠工程处理已经远远不够,这就需要提出一种新的数据思维来应对。著名数据库专家JimGray博士通过归纳总结了人类科学研究在经历了实践、理论、计算三种范式之后,认为在数据泛滥的时代,需要一种新的数据探索型方式,他将其定义为科学研究的“第四种范式”,即以数据处理为核心的思维方式。

1.2电力企业在大数据时代下面临的挑战

(1)收集数据。电力大数据时代,电力企业数据来源不仅是企业内部的历史年度数据,还包括来自互联网和信息机构的各种数据。收集这些信息是要附上相应的时空标志,必要的时候要剔除无效数据,同时,还应当尽可能收集不同数据来源、结构化程度不同的数据,并且做到尽可能和企业内部的历史数据相对照,以便于验证信息的可靠性和真实性,这对于电力企业来说,将是个不小的挑战。

(2)半结构化和结构化数据。现代互联网应用呈现出非结构化和半结构化数据大幅度增长的特点。据不完全统计,这类数据占有比例已达到整个数据量的75%以上。同时由于数据网络化的存在,使得这类数据的复杂关系无处不在。此外,这类数据是以数据流的形式存在,数据价值化的体现与时间呈现明显的相关性,价值稍纵即逝。尽管目前计算机智能化有了很大进步,但是还是只能针对有结构或类结构的数据进行分析,谈不上深层次的数据挖掘。

(3)数据网络背后的数据关系。大量观测数据虽然可以映射出各种复杂的网络系统,但是由于这些数据往往是孤立的数据点,映射出的数据网络难免片面,如何做好数据集成,使之成为一个完整的数据网络,这是值得思考的问题。以发电企业为例,单单考虑发电量数据,得到的只是发电厂发电量单一方面的数据。然而,发电数据是与电压数据、线损数据、用户用电数据等相互联系的,如何利用模糊分析方法,考虑这些数据的参数关系,分析复杂网络之间的联系,对发电企业来说将是一个巨大的挑战。另外,由于各个发电企业、供电企业没有统一对其专业化的信息系统进行建设,导致电力生产、销售各专业数据彼此独立,形成信息孤岛。为破除信息孤岛的数据壁垒,需要融合发电、输电、变电、配电以及用电等多方面数据,这就需要考虑如何对各环节多数据进行融合。

2电力大数据时代下数据挖掘技术

2.1数据挖掘技术

数据挖掘技术是通过对海量数据进行建模,并通过数理模型对企业的海量数据进行整理与分析,以帮助企业了解其不同的客户或不同的市场划分的一种从海量数据中找出企业所需知识的技术方法。如果说云计算为海量分布的电力数据提供了存储、访问的平台,那么如何在这个平台上发掘数据的潜在价值,使其为电力用户、电力企业提供服务,将成为云计算的发展方向,也将是大数据技术的核心议题。电力系统是一个复杂的系统,数据量庞大,特别是在电力企业进入大数据时代后,仅仅是电力设备运行和电力负荷的数据规模就已十分惊人。因此光靠传统的数据处理方法就显得不合时宜,而数据挖掘技术的实现为解决这一难题提供了新的出路。数据挖掘技术在电力系统负荷预测和电力系统运行状态监控、电力用户特征值提取、电价预测等方面有很好的应用前景。

2.2电力大数据时代数据挖掘技术的思考

IDC(国际数据公司)提出,在大数据时代,新数据类型和相应分析技术的缺失会是阻碍企业实现发展的重要因素。不过需要注意的是,数据挖掘技术能够挖掘出有价值信息的前提是使用上数据是高质量的、有效的。因此,电力企业为解决数据质量问题,应当设立必要的首席数据官,进行数据管理工作,保障数据的质量,进而保证数据挖掘技术能够挖掘出有价值的信息为电力企业决策服务。

3电力大数据时代下数据挖掘技术的实现

凭借电力营销决策支持系统,使用较好的数据的可视化设计,通过图形来表示数据当中的繁杂信息,把数据挖掘的结果可视化,然后把这项成果使用到电力企业以后的发展计划之中。并且把深度挖掘的信息可视化,这样让雇员们可以清晰的了解到电力企业以后发展的大致方向、辨别决策是否正确、成果是不是切合现实情况,这是评价整个系统的挖掘技术是不是成果的准则。

4展望

因为现实情况下数据中心的储存规模逐渐增大,使得电力企业在对用户信息实行提取、数据库维护、负荷预测的过程之中,高成本及高能耗变为限制大数据时代背景之下数据挖掘过程高效实行的阻碍。根据《纽约时报》及麦肯锡公司围绕耗能相关问题刊登的一篇文章曾说过,Google的数据中心每年耗电量大约是3MW,然而却仅仅只有6~12%是合理的使用。如今,我们国家的电力企业使服务器闲置消耗了许多的电能,用来应对负荷高峰。因此站在电力企业的角度,运用新型的低功耗硬件和引进可再生的新能源去构建一个绿色数据库这个方面去思考怎样解决能耗问题,把节省的能耗重新使用在基于时间序列相似性的电价预测这些方面,然后给数据挖掘工作打开新的局面。

5结语

总而言之,当前的电力企业为了实现更为高效的发展,一般都会通过构建一个信息资源系统,通过这一形式对各个环节的数据信息予以集合和统筹,为日后的企业发展指明方向,在实践发展中,也在对各类数据进行深层次的挖掘。现阶段会应用数据挖掘技术来实现高效的数据处理,随着社会的发展和时代的进步,数据挖掘技术的应用方式也在逐步的改革和深化,企业也意识到了运用此技术方式的重要性,并且在实践中将其应用优势体现出来,极大的推动我国电力事业的发展。

参考文献:

[1]岗巧针.国网新疆电力公司大数据智库平台安全技术解析[J].中国高新技术企业(中旬刊),2016.

[2]辛玲玲,丁筱筠.电力大数据的挖掘与应用探索[J].中小企业管理与科技,2015.

[3]魏三强,任环,杨威等.保护隐私的智能电网大数据分析挖掘技术[J].广西大学学报(自然科学版),2015.

[4]易正磊,顾军,张兴.基于大数据的业务并发度分析[J].中兴通讯技术,2015(05).

作者简介:

马捍超(1987.10.11-);男;新疆;回族;研究生;中级工程师;电力设备检测;国网新疆电力有限公司电力科学研究院。

苑龙祥(1985-);男;山东郓城;汉族;研究生;中级工程师;变电设备高压试验方向;新疆乌鲁木齐市国网新疆电力有限公司电力科学研究院。

标签:;  ;  ;  

浅谈大数据时代数据挖掘技术在电力企业中的应用
下载Doc文档

猜你喜欢