基于Web的图像数据挖掘研究与应用

论文摘要

WWW是一个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信息的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信息,具有十分重要的现实意义和广泛的应用前景。数据挖掘和知识发现为解决信息量过大而人们无法有效利用的问题提供了新的解决途径。目前,数据挖掘和知识发现的数据源主要是已有数据库中的文本和数值类数据,如何对分布于网络环境下的图像数据进行挖掘还未有充分研究。本文首先简单阐述了数据挖掘和知识发现的基本理论;分析了网络信息检索与挖掘的特征,特别是Web数据挖掘和基于内容的图像检索;进而探讨了基于Web的图像数据挖掘研究与应用的一系列基本问题,包括定义、挖掘对象的特征与分类、挖掘和发现所需的理论和技术以及系统的框架结构和功能模块的分析与设计等,力图为该方向的深入研究提供一些有益的思路。本文还研究了基于内容的图像检索技术(CBIR)的特点和方式,CBIR技术主要依据图像的画面内容特征和主题对象特征来进行检索;讨论了图像的颜色、纹理、形状、空间关系等方面的特征;提出了目前图像挖掘的主要技术,包括分类、聚类、关联规则和神经网络;总结了图像数据挖掘的重点和难点在于特征的提取和图像的表示方式、图像的比较策略、机器学习和图像的自动标注、检索系统的评价标准等几个方面。结合基于Web数据挖掘的方法和基于内容的图像检索,本文对WWW上的图像信息挖掘和检索系统进行了一些研究和探索,分析了Web图像搜索引擎的原理、图像分割方法和MPEG—7标准,为实现本文所设计的实验系统打下基础并构建了一个框架。通过上述内容的分析和研究,构建本文所设计的基于Web的图像数据挖掘的实验系统,首先分析了系统所需功能,为系统的实现打下理论基础,提出了多维数据立方在图像数据挖掘中的具体实现方法,针对图像数据和复杂性,简化了多维数据立方结构;采用最大出现次数算法,提高了系统计算规则的速度,设计了一个较为完整的实验系统模型,绘制了各功能模块的框图,给出了一个简化的Cdib类代码,并在系统中引入了徒手绘草图方法,试图增强系统的适用性。

论文目录

摘要

ABSTRACT

第1章绪论

1.1 引言

1.2 课题提出的背景

1.3 论文研究的主要内容

第2章数据挖掘理论

2.1 数据挖掘基本概念

2.2 数据挖掘技术

2.2.1 人工神经网络

2.2.2 决策树

2.2.3 遗传算法

2.2.4 关联规则挖掘算法

2.3 数据挖掘的步骤

2.4 数据挖掘的功能

2.5 本章小结

第3章基于内容的图像检索

3.1 概述

3.2 CBIR的主要特点

3.3 CBIR的主要方式和系统结构

3.4 低层视觉特征

3.4.1 颜色特征

3.4.2 形状特征

3.4.3 纹理特征

3.4.4 空间关系特征

3.5 相似性测量

3.6 图像挖掘技术

3.6.1 图像数据的相似性搜索

3.6.2 图像关联规则挖掘

3.6.3 图像分类

3.6.4 图像聚类

3.6.5 神经网络

3.7 图像数据挖掘研究的重点和难点

3.8 本章小结

第4章基于Web的图像数据挖掘

4.1 Web数据挖掘简介

4.2 Web挖掘的任务

4.3 Web挖掘的分类

4.4 Web图像搜索引擎分析

4.5 Web图像搜索引擎主要结构

4.6 图像分割

4.7 基于MPEG-7的面向对象的图像内容描述模型

4.8 本章小结

第5章基于Web的图像数据挖掘实验系统

5.1 实验系统功能分析

5.1.1 多媒体数据的检索

5.1.2 多媒体数据立方体

5.1.3 数据挖掘功能模块

5.2 最大出现次数算法

5.2.1 问题描述

5.2.2 算法描述

5.2.3 结论

5.2 实验系统模块设计

5.2.1 需求说明

5.2.2 实验系统总体结构设计

5.2.3 实验系统核心结构设计

5.2.4 图像搜集与挖掘子系统

5.2.5 库管理子系统

5.2.6 面向用户的检索子系统

5.3 使用徒手绘草图方法挖掘图像

5.3.1 检索原理

5.3.2 相似性匹配

5.3.3 检索结果

5.4 基于Web图像挖掘实验系统的应用界面

5.5 图像数据挖掘面临的障碍和挑战

5.6 本章小结

第6章结束语

6.1 下一步的工作

6.2 结论与展望

参考资料

致谢

学位论文评阅及答辩情况表

基于Web的图像数据挖掘研究与应用

论文摘要

论文目录

相关论文文献

猜你喜欢