论文摘要
数据挖掘(Data Mining)是近年来十分热门的一个学科,是指从存放在数据库、数据仓库或其他信息库中的大量数据中提取隐含的、未知的、有潜在应用价值的信息或模式的过程,被认为是数据库系统最重要的前沿之一。聚类分析是其重要的挖掘技术之一,它就是基于“物以类聚”的朴素思想,将物理或抽象对象的集合分组成为由类似的对象组成的多个类或簇的过程。它使在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大,用这种方法可以解决许多数据预处理阶段的数值残缺问题。但是,孤立对象的存在并不一定毫无意义,其本身可能是非常有用的,对其进行研究就是时下十分流行的离群数据挖掘。本文在对分析了几种离群数据挖掘方法的基础上,改进了基于距离的离群数据挖掘方法,并将其运用到大连供电公司线损自动生成系统中。本文的主要工作:(1)介绍了数据挖掘的基本概念,数据挖掘知识表示模式及方法,详细介绍了数据挖掘的过程和相关研究领域,并阐述了数据挖掘面临的问题。(2)对聚类算法进行相关描述,介绍了聚类分析的几种算法,以及其应用现状。(3)对离群数据挖掘和基于距离的离群数据挖掘进行相关描述。(4)对供电企业的线损自动生成系统进行了相关研究(包括:背景、立题、设计原则、软硬件配置及模块主要功能等)。(5)根据系统实际情况,在现有的基于距离的离群算法的基础上进行改进,并应用于供电企业的线损自动生成系统上,实现了降损和反窃电的目标。
论文目录
摘要ABSTRACT绪论第一章 课题概述1.1 数据挖掘技术的产生及研究现状1.2 聚类分析1.3 离群数据挖掘1.4 供电企业线损研究现状1.5 本文的主要工作本章小结第二章 数据挖掘2.1 数据挖掘概述2.1.1 数据挖掘的概念2.1.2 数据挖掘的知识表示模式及方法2.1.3 数据挖掘的知识发现过程2.2 数据挖掘的特点2.3 数据挖掘技术的应用现状2.4 数据挖掘面临的问题本章小结第三章 聚类分析3.1 聚类分析定义3.2 聚类分析的算法3.2.1 基于划分的方法(Partitioning Methods)3.2.2 基于层次的方法(Hierarchical Methods)3.2.3 基于密度的方法(Density-Based Methods)3.2.4 基于网格的方法(Grid-Based Methods)3.2.5 基于模型的方法(Model-Based Methods)3.3 聚类分析的应用现状本章小结第四章 离群数据挖掘4.1 离群数据挖掘定义4.2 离群数据挖掘的方法4.2.1 基于统计的离群数据挖掘方法4.2.2 基于距离的离群数据挖掘方法4.2.3 基于偏离的离群数据挖掘方法4.2.4 其他离群数据挖掘方法4.3 基于距离的离群数据挖掘4.3.1 离群数据的定义4.3.2 距离的量度4.3.3 数据标准化4.3.4 基于距离的离群数据挖掘算法4.3.5 基于距离的离群数据挖掘的优缺点4.4 离群数据挖掘的应用现状本章小结第五章 大连供电公司线损自动生成系统及应用实例5.1 课题研究的背景和目标5.1.1 大连供电公司线损现状简介5.1.2 改进算法研究背景5.1.3 课题目标5.2 课题准备5.3 设计原则5.3.1 数据准确性5.3.2 数据完整性5.3.3 数据一致性5.3.4 数据计量的同时性5.3.5 线损统计应用模式的开放性5.3.6 系统操作或管理的安全性5.3.7 系统设计的可靠性5.3.8 电能量数据采集的及时性5.3.9 系统实用性5.4 系统结构5.4.1 主站系统5.4.2 通信通道基本要求5.4.3 终端设备基本要求5.4.4 系统软件配置5.5 主要功能模块5.5.1 数据采集功能5.5.2 数据处理功能5.5.3 电量统计查询功能5.5.4 线损自动生成功能5.5.5 线损分析功能5.5.6 报表处理功能5.5.7 辅助指标考核5.5.8 系统管理功能5.5.9 报警管理功能5.5.10 WEB 浏览功能5.6 系统应用特点5.6.1 统一的通讯规约5.6.2 采用GPRS/CDMA 技术5.6.3 充分利用现有信息资源,实现信息共享5.6.4 系统业务模型丰富5.6.5 采用软件支撑平台以及分布式CORBA 技术5.6.6 采用完全独立于软硬件平台的J2EE/ Java 技术5.6.7 实时数据库与历史数据库有机结合5.6.8 用原始数据库和加工数据库机制保证数据安全5.7 改进的基于距离的离群数据挖掘算法描述及应用实例5.7.1 改进的基于距离的离群数据算法-DS 算法5.7.2 实验实例5.8 系统应用实现的效益本章小结结论参考文献攻读硕士学位期间发表的学术论文致谢
相关论文文献
标签:数据挖掘论文; 聚类分析论文; 离群数据挖掘论文; 线损管理论文;