基于文本机会发现的共识与非共识标签区分方法

基于文本机会发现的共识与非共识标签区分方法

论文摘要

随着Web2.0的迅速发展,标签作为其中一个典型的应用开始被越来越多的人所关注和使用。标签是与某个网络资源相关的一个简短的词或者短语,用户可以通过资源指定若干标签的方式对资源进行分类。标签这种由用户自己自由管理的特点充分利用了用户的知识,同时也为标签信息的处理带来了非常大的挑战。如何通过标签对资源进行合理的组织是当前的一个研究热点,已有的对于标签的研究,多数基于用户对标签的使用存在共识这一前提主要着眼于标签之间的相互关联,很少考虑标签同资源之间的关联。针对上述问题,本文通过对标签共识性的深入研究,提出共识标签和非共识标签的概念以及基于文本机会发现的共识与非共识标签的区分方法。本文首先分析标签使用的特点,详细分析共识标签和非共识标签的成因以及标签共识性的演化,给出共识标签和非共识标签的概念,提出共识与非共识标签区分方法的研究框架。共识与非共识标签的区分方法的基本原理:提取标签在特定博文上的共现词,合并标签在所有标记的博文上的共现词,构成标签的关联词集合;依据该集合判定标签为共识标签或非共识标签。在此基础上,本文给出基于KeyGraph算法的标签共现词选取算法和基于主观贝叶斯方法的共识标签判定算法。基于KeyGraph算法的标签共现词选取算法的核心是选取博文的关键词中与特定标签有密切关联的词汇作为标签的共现词,以此反映标签在特定博文上的语义。基于主观贝叶斯方法的共识标签判定算法的通过合并标签的所有共现词,形成标签的关联词集合,利用该集合反映标签使用的一般性规律。该算法以关联词集合作为输入数据,计算出标签为共识标签的概率,判定标签是否为共识标签。最后给出共识标签的两个应用:共识标签补充和标签关联词集合划分。共识标签补充用于为博文补充共识标签,标签关联词集合划分用于分析标签的不同语义。通过实验分析,验证了本文提出方法的有效性。

论文目录

  • 摘要
  • Abstract
  • 第1章 引言
  • 1.1 课题的背景和意义
  • 1.2 研究目标和研究内容
  • 1.3 论文的组织结构
  • 第2章 研究基础
  • 2.1 标签及大众分类法
  • 2.1.1 大众分类法
  • 2.1.2 标签的相关研究
  • 2.2 文本机会发现
  • 2.3 不确定性推理
  • 2.4 本章小结
  • 第3章 标签的共识性
  • 3.1 标签共识性的分析
  • 3.1.1 共识标签和非共识标签
  • 3.1.2 非共识标签的成因
  • 3.1.3 共识标签的特殊特性
  • 3.1.4 标签共识性的演化
  • 3.2 共识标签与非共识标签的区分
  • 3.2.1 共识标签和非共识标签区分方法的执行过程
  • 3.2.2 基于共现词的博文模型
  • 3.2.3 基于关联词的标签模型
  • 3.3 共识标签的应用
  • 3.3.1 共识标签补充
  • 3.3.2 标签关联词集合的划分
  • 3.4 本章小结
  • 第4章 基于KEYGRAPH算法的标签共现词选取算法
  • 4.1 标签共现词选取算法的研究思路
  • 4.2 KeyGraph算法提取博文关键词
  • 4.3 标签共现词选取核心算法
  • 4.3.1 标签共现词的选取依据
  • 4.3.2 标签与博文关键词的关联度
  • 4.3.3 基于层次遍历的标签共现词选取算法
  • 4.4 相关实验
  • 4.4.1 数据集
  • 4.4.2 实验内容及结果分析
  • 4.5 本章小结
  • 第5章 基于主观贝叶斯方法的共识标签判定算法
  • 5.1 标签关联词集合
  • 5.2 基于主观贝叶斯方法的共识标签判定算法
  • 5.2.1 共识标签判定算法的基本思路
  • 5.2.2 高频关联词的判定
  • 5.2.3 主观贝叶斯方法中相关参数的选取
  • 5.2.4 共识标签判定算法的详细流程
  • 5.3 相关实验
  • 5.3.1 数据集
  • 5.3.2 实验内容及结果分析
  • 5.4 本章小结
  • 第6章 共识标签的使用
  • 6.1 共识标签补充
  • 6.1.1 共识标签补充的研究思路
  • 6.1.2 关键词——共识标签矩阵
  • 6.1.3 标签与博文的关联度
  • 6.1.4 标签与博文的关联权重
  • 6.1.5 补充标签选取标准
  • 6.1.6 共识标签补充的执行过程
  • 6.2 标签关联词集合的划分
  • 6.2.1 关联词集合划分的方法
  • 6.2.2 关联词集合划分结果的含义
  • 6.3 相关实验
  • 6.3.1 共识标签补充相关实验
  • 6.3.2 标签关联词集合划分的相关实验
  • 6.4 本章小结
  • 第7章 结束语
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].压敏标签供送装置中剥离机构的设计[J]. 河南科技 2019(34)
    • [2].浅议通过标签查找“问题”农药[J]. 种子科技 2019(17)
    • [3].图像多标签学习的研究概述[J]. 南京信息工程大学学报(自然科学版) 2019(06)
    • [4].医院中药房成药定位标签的设计与评价[J]. 中医药管理杂志 2020(01)
    • [5].基于大数据的患者画像标签体系构建方法及应用研究[J]. 中国卫生信息管理杂志 2019(06)
    • [6].基于标签语义挖掘的城市画像感知研究[J]. 数据分析与知识发现 2019(12)
    • [7].RFID标签及其加工应用浅谈[J]. 印刷杂志 2020(02)
    • [8].基于深度学习的多标签生成研究进展[J]. 计算机科学 2020(03)
    • [9].饲料标签常见问题及分析讨论[J]. 饲料博览 2020(02)
    • [10].芬欧蓝泰标签的新型纸质标签材料包含可回收成分[J]. 网印工业 2020(05)
    • [11].警情热点标签的设计和应用[J]. 大众标准化 2020(07)
    • [12].探讨无线发射台站标签规范化[J]. 视听 2020(03)
    • [13].一种基于标签融合的微博主题生成方法[J]. 辽东学院学报(自然科学版) 2020(02)
    • [14].钢材成品二维码标签系统设计[J]. 包钢科技 2020(03)
    • [15].通过标签嵌入从社交标签中挖掘上下位关系[J]. 指挥信息系统与技术 2020(04)
    • [16].多类别相关性结合的类属属性多标签学习[J]. 模式识别与人工智能 2020(08)
    • [17].基于标签相关性的类属属性多标签分类算法[J]. 计算机应用研究 2020(09)
    • [18].用行动擦亮爱国奉献的人生标签[J]. 新长征 2019(01)
    • [19].标签的“前世今生”[J]. 今日印刷 2019(03)
    • [20].国内外纺织品和服装护理标签概述[J]. 中国纤检 2017(01)
    • [21].富士通开发“几乎看不见”的RFID标签[J]. 广东印刷 2016(06)
    • [22].基于补全矩阵的多标签相关性情感分类[J]. 计算机系统应用 2017(01)
    • [23].基于本体和标签的个性化推荐[J]. 情报理论与实践 2016(12)
    • [24].红酒标签秒变“故事书”,你见过吗?[J]. 印刷技术 2017(01)
    • [25].基于相对频次的标签相关性判断优化研究[J]. 图书情报工作 2016(17)
    • [26].物联网之于数字标签的挑战与机遇[J]. 今日印刷 2017(04)
    • [27].基于标签的矩阵分解推荐算法[J]. 计算机应用研究 2017(04)
    • [28].一种融合个性化与多样性的人物标签推荐方法[J]. 中文信息学报 2017(02)
    • [29].一种基于标签推荐的服务聚类方法[J]. 计算机与数字工程 2017(06)
    • [30].服装护理标签的确定及验证[J]. 纺织导报 2017(08)

    标签:;  ;  

    基于文本机会发现的共识与非共识标签区分方法
    下载Doc文档

    猜你喜欢