基于粗糙集的分类知识发现及在信息推送中的应用

基于粗糙集的分类知识发现及在信息推送中的应用

论文摘要

基于网格的信息分发系统中,需要处理海量信息。若不能进行正确处理,就会产生信息淹没与数据垃圾,无法获取信息优势。本文研究的信息智能推送正是针对这个问题而提出。信息智能推送是信息分发系统的一个重要组成部分,其主要目标是保证将有效信息推送给真正需要它的用户。信息智能推送的关键部分是用户兴趣发现,它通过对用户历史访问信息的行为进行学习,找出不同用户对不同类型信息的潜在兴趣。实质上,用户兴趣发现可归属于分类知识发现的范畴。分类知识发现将通过对反映用户历史访问行为的用户信息需求进行分类预测分析,把用户信息需求分为有兴趣与无兴趣两大类。分类知识发现模型可由不同的分类知识发现技术来构建。但是,有的分类知识发现技术建立的模型要么比较复杂,要么需要一定的先验知识——这种方式具有主观性。粗糙集作为一种强的数据分析工具,与其它知识挖掘技术相比,在解决分类问题上有独到的优势,在较少的数据中也可挖掘出较好的规则或知识,生成的规则易于理解,而且该方法简单、易于操作。鉴于上述分析,本文对基于粗糙集的分类知识发现进行了研究。重点研究了基于粗糙集的分类知识发现模型中的重要部分——属性约简,分类规则约简,以及分类预测。在属性约简方面,结合属性约简的基本概念,提出了求绝对核的算法,重新定义了属性重要性度量,使之更具有合理性。以此为基础,改进了属性约简算法,此算法提高了计算效率。在规则约简方面,重新定义了核值,使之适用于不一致决策表。以此为基础,结合重新定义的属性重要性度量,提出了既适合一致决策表又适合不一致决策表的分类规则约简算法。在分类预测方面,将基于相似度的分类预测方法应用于无规则匹配的情况。本文还对上述所提算法在信息智能推送中的应用进行了研究。一方面,在信息分发系统总体结构的基础上,对信息智能推送功能进行了分析和设计。另一方面,研究了基于粗糙集的分类知识发现在信息智能推送中的应用,实现了用户兴趣发现。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 论文选题的目的和意义
  • 1.2 本文研究内容与各章节安排
  • 第二章 相关理论及技术
  • 2.1 全球信息网格
  • 2.1.1 网格概念和特点
  • 2.1.2 全球信息网格概念
  • 2.1.3 信息分发管理
  • 2.2 分类知识发现
  • 2.2.1 知识发现的概念
  • 2.2.2 知识发现的功能
  • 2.2.3 分类知识发现的概念
  • 2.2.4 分类知识发现的过程
  • 2.3 粗糙集理论
  • 2.3.1 粗糙集的核心思想
  • 2.3.2 粗糙集的基本概念
  • 2.3.3 粗糙集的知识表达
  • 2.3.4 粗糙集知识表达的数字特征
  • 2.4 本章小结
  • 第三章 基于粗糙集的分类知识发现
  • 3.1 粗糙集分类知识发现模型
  • 3.2 决策表的属性约简
  • 3.2.1 属性约简的相关概念
  • 3.2.2 基于信息熵的属性约简
  • 3.3 决策表的分类规则约简
  • 3.3.1 分类规则相关概念
  • 3.3.2 核值的定义
  • 3.3.3 分类规则约简算法
  • 3.3.4 算例
  • 3.4 新对象的分类预测
  • 3.4.1 分类规则的度量参数
  • 3.4.2 分类预测模型
  • 3.4.3 基于相似度的分类预测
  • 3.5 本章小结
  • 第四章 信息智能推送设计
  • 4.1 信息分发系统整体描述
  • 4.1.1 信息分发系统网络结构简述
  • 4.1.2 信息分发系统功能介绍
  • 4.2 开发与应用环境
  • 4.3 信息智能推送功能分析
  • 4.4 信息推送设计
  • 4.4.1 信息推送UML建模分析与设计
  • 4.4.2 推送流程设计
  • 4.4.3 信息推送Web设计
  • 4.5 用户兴趣发现设计
  • 4.6 本章小结
  • 第五章 基于粗糙集的用户兴趣发现
  • 5.1 用户信息需求聚类分析
  • 5.1.1 数据准备
  • 5.1.2 聚类分析流程
  • 5.2 用户信息需求分类规则获取
  • 5.3 新用户信息需求对象分类预测
  • 5.4 本章小结
  • 第六章 结束语
  • 致谢
  • 参考文献
  • 攻硕期间获奖与发表论文
  • 相关论文文献

    • [1].维基百科中查询分类知识挖掘方法研究[J]. 小型微型计算机系统 2014(07)
    • [2].科学活动:两层分类[J]. 儿童与健康 2016(Z2)
    • [3].英汉非等值习语分类知识库的构建及应用[J]. 辞书研究 2014(04)
    • [4].分布式环境下分类知识的挖掘算法研究[J]. 计算机与数字工程 2008(05)
    • [5].分类知识组织体系互操作系统设计与实现[J]. 图书馆杂志 2015(08)
    • [6].基于“翻转课堂”的任务单设计——以高中《网络技术应用》中IP分类知识点为例[J]. 考试周刊 2016(31)
    • [7].养鸟小志[J]. 北京农业 2013(13)
    • [8].基于本体的分类知识管理方法研究[J]. 信息与电脑(理论版) 2011(24)
    • [9].高考“物质的组成与分类”易错点解读[J]. 中学生数理化(高二高三版) 2015(01)
    • [10].巧用思维导图进行语文教学[J]. 新课程(小学) 2018(08)
    • [11].一种动态信任度量与预测方法研究[J]. 计算机工程与科学 2010(09)
    • [12].可拓分类知识挖掘系统的设计与实现[J]. 计算机应用与软件 2017(01)
    • [13].《认识角》微课程设计[J]. 中国信息技术教育 2016(Z1)
    • [14].近代鱼类分类知识在民国地方志中的传播——以福建地方志为中心[J]. 安徽史学 2013(03)
    • [15].基于可拓集的可拓分类知识获取研究[J]. 数学的实践与认识 2008(16)
    • [16].图书分类中常见的问题解析及其对策[J]. 管理观察 2015(16)
    • [17].《化学品GHS分类方法指导和范例》一书出版[J]. 化工环保 2011(01)
    • [18].《化学品GHS分类方法指导和范例》一书出版[J]. 化工环保 2011(03)
    • [19].《英语周报》向您推荐——《学记考宝典》[J]. 英语知识 2012(09)
    • [20].曲线中切点连线问题的应用探析[J]. 科学中国人 2016(18)
    • [21].园林树木学教学现存问题的探讨[J]. 现代园艺 2016(07)
    • [22].《英语周报》向您推荐——《学记考宝典》 诠释学习记忆应试秘诀 快速提升高考各科成绩[J]. 英语知识 2011(10)
    • [23].《英语周报》向您推荐——《学记考宝典》[J]. 英语知识 2011(12)
    • [24].公共知识:“文化族群”/“国家民族”与公民[J]. 北方民族大学学报(哲学社会科学版) 2010(04)
    • [25].针对参变量数据元集的可拓建筑策划分类知识挖掘方法[J]. 科技导报 2014(36)
    • [26].《英语周报》向您推荐——《学记考宝典》[J]. 英语知识 2012(02)
    • [27].《英语周报》向您推荐——《学记考宝典》[J]. 英语知识 2012(03)
    • [28].《英语周报》向您推荐——《学记考宝典》[J]. 英语知识 2012(11)
    • [29].备考中如何准确快速书写离子方程式[J]. 课程教育研究 2016(22)
    • [30].《英语周报》向您推荐——《学记考宝典》诠释学习记忆应试秘诀 快速提升高考各科成绩[J]. 英语知识 2010(09)

    标签:;  ;  ;  ;  ;  

    基于粗糙集的分类知识发现及在信息推送中的应用
    下载Doc文档

    猜你喜欢