面向SNS的社会化标签的数据挖掘与程序框架设计

面向SNS的社会化标签的数据挖掘与程序框架设计

论文摘要

随着越来越多的人参于网络内容的编辑,“分众分类”法也逐渐成为网络资源分类的重要方法。本文主要研究“分众分类”法的优缺点,对其缺点之中的“模糊性”进行了针对性研究,在认真分析其产生原因与深入研究他人成果的基础之上,提出了自己的聚类改进方案,并设计了抓取和聚类程序;在框架设计过程中,将整个程序分成抓取数据、清洗数据、聚类、图形显示四个部分。通过VC++6.0与SQL2005平台的混合编程,实现了程序总体框架,并利用设计模式将四部分有机地结合在一起,做到了低耦合高内聚、易扩展和易维护。最后对其功能是否正确,数据库是否被正确地访问以及聚类结果是否合理进行了黑盒测试,分析了“基于语义的聚类方案”形成的簇集,对是否达到预期目的进行判断,并在多次改变聚类条件后,分析并找出影响形成不同簇集结果的原因。通过对“分众分类”法中标签进行研究,并通过聚类重新组合标签组形成簇集,即对大众分类进行二次专业分类形成新的标签组,降低了标签的“模糊性”,从而提高了网络用户查询时的“检全率”、“命中率”、“命准率”。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 课题意义及国内外发展状况
  • 1.2.1 研究意义
  • 1.2.2 国内外研究概况
  • 1.3 研究目标与主要内容
  • 1.4 拟采取的研究方法、研究手段及技术路线
  • 1.5 研究的预期目标
  • 1.6 本文结构
  • 第二章 框架与设计模式应用
  • 2.1 系统结构的可复用设计解决方案
  • 2.2 框架定义
  • 2.2.1 框架的设计过程
  • 2.2.2 框架的设计原则和特征
  • 2.3 设计模式应用
  • 2.4 设计模式的选取
  • 第三章 系统应用框架设计
  • 3.1 系统概述
  • 3.2 系统层次划分
  • 3.3 逻辑框架结构与设计模式方案选择
  • 3.4 框架类结构图
  • 第四章 爬虫程序设计与实现
  • 4.1 爬虫程序简介
  • 4.2 Flickr网页结构
  • 4.3 数据抓取搜索策略
  • 4.4 爬虫设计应该注意的问题
  • 4.5 爬虫程序设计
  • 4.5.1 爬虫程序结构
  • 4.5.2 三个数据线程的配合
  • 4.5.3 各线程逻辑关系
  • 4.5.4 各线程活动图描述
  • 第五章 算法设计与实现
  • 5.1 数据挖掘概述
  • 5.2 数据清理
  • 5.3 挖掘算法选取
  • 5.4 聚类算法描述
  • 5.5 划分方法
  • 5.5.1 划分方法描述
  • 5.5.2 典型划分算法K中心点算法的改进
  • 5.6 基于语义分析聚类算法的实现
  • 第六章 平台与算法测试
  • 6.1 测试概述
  • 6.2 功能性与数据库测试
  • 6.3 系统结构扩展性测试
  • 6.4 聚类算法正确性测试
  • 总结与展望
  • 参考文献
  • 附录
  • 致谢
  • 相关论文文献

    • [1].压敏标签供送装置中剥离机构的设计[J]. 河南科技 2019(34)
    • [2].浅议通过标签查找“问题”农药[J]. 种子科技 2019(17)
    • [3].图像多标签学习的研究概述[J]. 南京信息工程大学学报(自然科学版) 2019(06)
    • [4].医院中药房成药定位标签的设计与评价[J]. 中医药管理杂志 2020(01)
    • [5].基于大数据的患者画像标签体系构建方法及应用研究[J]. 中国卫生信息管理杂志 2019(06)
    • [6].基于标签语义挖掘的城市画像感知研究[J]. 数据分析与知识发现 2019(12)
    • [7].RFID标签及其加工应用浅谈[J]. 印刷杂志 2020(02)
    • [8].基于深度学习的多标签生成研究进展[J]. 计算机科学 2020(03)
    • [9].饲料标签常见问题及分析讨论[J]. 饲料博览 2020(02)
    • [10].芬欧蓝泰标签的新型纸质标签材料包含可回收成分[J]. 网印工业 2020(05)
    • [11].警情热点标签的设计和应用[J]. 大众标准化 2020(07)
    • [12].探讨无线发射台站标签规范化[J]. 视听 2020(03)
    • [13].一种基于标签融合的微博主题生成方法[J]. 辽东学院学报(自然科学版) 2020(02)
    • [14].钢材成品二维码标签系统设计[J]. 包钢科技 2020(03)
    • [15].通过标签嵌入从社交标签中挖掘上下位关系[J]. 指挥信息系统与技术 2020(04)
    • [16].多类别相关性结合的类属属性多标签学习[J]. 模式识别与人工智能 2020(08)
    • [17].基于标签相关性的类属属性多标签分类算法[J]. 计算机应用研究 2020(09)
    • [18].用行动擦亮爱国奉献的人生标签[J]. 新长征 2019(01)
    • [19].标签的“前世今生”[J]. 今日印刷 2019(03)
    • [20].国内外纺织品和服装护理标签概述[J]. 中国纤检 2017(01)
    • [21].富士通开发“几乎看不见”的RFID标签[J]. 广东印刷 2016(06)
    • [22].基于补全矩阵的多标签相关性情感分类[J]. 计算机系统应用 2017(01)
    • [23].基于本体和标签的个性化推荐[J]. 情报理论与实践 2016(12)
    • [24].红酒标签秒变“故事书”,你见过吗?[J]. 印刷技术 2017(01)
    • [25].基于相对频次的标签相关性判断优化研究[J]. 图书情报工作 2016(17)
    • [26].物联网之于数字标签的挑战与机遇[J]. 今日印刷 2017(04)
    • [27].基于标签的矩阵分解推荐算法[J]. 计算机应用研究 2017(04)
    • [28].一种融合个性化与多样性的人物标签推荐方法[J]. 中文信息学报 2017(02)
    • [29].一种基于标签推荐的服务聚类方法[J]. 计算机与数字工程 2017(06)
    • [30].服装护理标签的确定及验证[J]. 纺织导报 2017(08)

    标签:;  ;  ;  ;  ;  ;  

    面向SNS的社会化标签的数据挖掘与程序框架设计
    下载Doc文档

    猜你喜欢