论文摘要
网格计算的出现使得大规模跨组织、跨区域的数据共享和协同工作成为可能。在科学研究领域中,现代科学研究的问题空前复杂化,产生了一种崭新的科研协作模式和大科学工程,即“科学研究的信息化”。这就需要以网格为基础,通过Internet联合组成一个共同的虚拟研究团队,共享资源和成果,协同工作,共同完成大型现代科学研究。本文的工作以科学数据网格和科学数据库为背景,致力于在现有海量数据存储和强大计算能力的基础上,通过数据挖掘技术来进一步提升其服务水平。本文的主要研究内容和创新成果包括:(1)科学数据网格环境下的科学数据挖掘系统本文在分析科学数据网格环境下数据挖掘之特点的基础上,提出了网格环境下的数据挖掘解决方案——科学数据挖掘系统。该系统主要由三部分构成:科学数据挖掘系统结构描述了数据挖掘程序中基于多维模型的三层结构;科学数据挖掘工具集提供了大量的数据预处理算法和数据挖掘算法;科学数据挖掘网格服务以网格服务的形式提供了科学数据网格环境下的数据挖掘解决方案。与传统的数据挖掘系统相比,科学数据挖掘系统具有诸多优异的特点,更为适合科学数据网格和科学数据库环境。目前,科学数据挖掘系统已经实际应用于几个数据库中。该系统不仅具有简单的查询检索功能,而且可以进行数据统计分析及知识发现,从而能够进一步提高了数据库提供服务的水平。(2)基于聚类的量化关联规则挖掘算法聚类分析技术是一个把相似的对象分在相同簇、相异对象分在不同簇的分组过程。被发现的簇可以用来解释数据分布的特点。本文提出了一种新颖的量化关联规则挖掘方法,可以解决现有基于布尔型关联规则的挖掘算法不能直接处理类别型和数值型数据的问题。这种方法使用聚类算法把数据库中的交易记录分成若干个簇,然后把簇投影到数值型属性所在的域,形成重叠、有意义的区间。实验结果表明这种方法能够有效地挖掘量化关联规则,并且能够发现现有算法可能遗漏的重要规则。(3)基于过滤器的用户访问模式挖掘针对传统用户访问模式挖掘系统中用户识别和会话识别的复杂性和不准确性,本文提出了一个基于过滤器的用户访问模式挖掘系统,给出了日志过滤器的实现和部署机制,并在此基础上提出了相应的用户访问模式挖掘算法。该系统目前已实际应用于科学数据库系统中,能够准确地识别用户和会话,为挖掘算法提供优质的数据,效果明显优于以前直接挖掘Web日志的方法。
论文目录
相关论文文献
- [1].空间数据网格概念探析[J]. 内江科技 2016(11)
- [2].中国科学院科学数据网格建设的进展[J]. 科研信息化技术与应用 2011(02)
- [3].关于建立我国环境大数据网格组织标准的若干思路[J]. 中国环境管理 2015(06)
- [4].人地系统科学数据网格[J]. 科研信息化技术与应用 2011(02)
- [5].校园数据网格安全体系结构的研究与设计[J]. 内蒙古工业大学学报(自然科学版) 2011(04)
- [6].本体在制造数据网格中的应用研究[J]. 机械工程师 2008(02)
- [7].现代企业数据网格的研究与设计[J]. 消费导刊 2008(09)
- [8].基于相似场境推荐的数据网格副本选择策略[J]. 微电子学与计算机 2012(09)
- [9].树形数据网格中实现副本放置的一种优化算法[J]. 电子测量与仪器学报 2019(02)
- [10].异地异构化学数据资源整合平台——化学数据网格[J]. 科研信息化技术与应用 2011(01)
- [11].基于数据网格的视频点播的研究[J]. 怀化学院学报(自然科学) 2008(02)
- [12].数据网格的存储资源预留方法[J]. 哈尔滨工业大学学报 2010(03)
- [13].地学领域数据网格的构建与其应用案例分析[J]. 地球信息科学学报 2011(03)
- [14].基于本体的禽流感科学数据网格的资源描述[J]. 计算机应用与软件 2008(05)
- [15].基于数据网格的PACS数据备份和恢复研究[J]. 北京生物医学工程 2008(02)
- [16].基于网格双层动态副本创建策略的改进[J]. 信息与电脑(理论版) 2012(18)
- [17].基于jQuery EasyUI的可编辑数据网格功能分析与实现[J]. 信息与电脑(理论版) 2018(15)
- [18].引入Ontology的制造数据网格相关问题探讨[J]. 煤炭技术 2012(06)
- [19].浅谈数据网格技术[J]. 科学之友 2010(08)
- [20].基于生产消耗模型与松弛时间的数据网格服务可靠性研究[J]. 计算机集成制造系统 2009(11)
- [21].数据网格中一种QoS驱动的副本选择算法[J]. 北京交通大学学报 2010(02)
- [22].云环境下一种兼顾成本与存储空间的副本策略[J]. 计算机工程 2018(03)
- [23].基于内容分发的数据网格副本创建策略[J]. 计算机应用研究 2012(10)
- [24].间隔执行的异步副本放置策略[J]. 计算机科学与探索 2018(08)
- [25].数据网格中一种均衡性能的副本一致性算法[J]. 计算机工程与应用 2010(22)
- [26].最新版Oracle Coherence 3.6上市[J]. 国防制造技术 2010(04)
- [27].基于数据网格的经费决算系统研究与设计[J]. 电脑知识与技术 2014(15)
- [28].基于网格技术的科学数据存储与共享[J]. 图书情报工作 2011(13)
- [29].航运大数据是一座富矿[J]. 中国船检 2018(06)
- [30].基于数据网格技术的研究与分析[J]. 电脑与信息技术 2008(02)
标签:科学数据网格论文; 科学数据挖掘系统论文; 网格服务论文; 多维模型论文; 数据预处理论文; 量化关联规则论文; 聚类论文; 分类论文; 序列模式论文; 过滤器论文; 访问模式论文;