基于本体的可伸缩的社会网络抽取算法的研究

基于本体的可伸缩的社会网络抽取算法的研究

论文摘要

在对专业领域社会网络的抽取过程中涉及很多大数据集,将社会网络的抽取应用到一个大的组织(用户群)的时候,提交到搜索引擎中的关键字的数目成为了一个关键性的问题。由于需要将所有结点进行完全配对搜索和计算,大数据集和多关键字在时间和空间上开销太大,因此研究人员提出用部分计算的方法确定结点间关系,从而出现了社会网络抽取的可伸缩性问题。对于社会网络抽取可伸缩性问题的研究,虽然许多学者提出了一些能够有效地降低计算时间和存储空间的解决方法,但仍存在结果准确性敏感于阈值设置等客观条件的问题,即运算的准确度随着客观条件的改变而产生很大差异。本文提出一种基于本体的、具有可伸缩的实现社会网络抽取算法Ontology-Scalability,该算法应用本体进行相关领域数据存储并减少搜索引擎中需检索的关键字数目,从而提高网络中结点关系的计算和存储效率。本文首先介绍了社会网络定义及相关概念、社会网络分析在计算机科学领域中的应用,之后对现有的社会网络抽取算法进行了归纳,并对其中的代表算法作了简要的分析。本文重点讨论了本体的构建,给出了支持社会网络分析的本体的构建方法,在此基础上提出了一个基于本体的、具有可伸缩的社会网络抽取算法,文中详细描述了算法的思想、实现过程及性能评价。本文的算法计算时间复杂度由传统算法的O(n2)降低为O(n),实验表明该算法相较于传统算法在时间性能上有很大提高。它具有对大数据集的数据进行社会网络抽取时间短、召回率(准确率)高等优点。更重要的是,算法中构建的本体是通过领域性的数据构建,可以重复利用在不同的系统中。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 绪论
  • 1.1 社会网络概述
  • 1.1.1 社会网络概念
  • 1.1.2 社会网络划分
  • 1.1.3 社会网络表示
  • 1.2 社会网络分析与应用
  • 1.2.1 社会网络分析概念
  • 1.2.2 社会网络分析应用
  • 1.3 问题提出
  • 1.4 课题来源
  • 1.5 全文组织结构
  • 第二章 相关技术及研究背景
  • 2.1 相关概念
  • 2.1.1 语义Web概述
  • 2.1.2 本体概述
  • 2.1.3 本体在社会网络分析的作用
  • 2.2 相关工作
  • 2.3 研究背景
  • 2.4 本章小结
  • 第三章 社会网络抽取算法分析
  • 3.1 传统算法及分析
  • 3.2 改进算法及分析
  • 3.3 本文的改进思路
  • 3.4 本章小结
  • 第四章 支持社会网络分析的本体构建
  • 4.1 本体简述
  • 4.1.1 本体概念
  • 4.1.2 本体分类
  • 4.1.3 本体构建原则、步骤和方法
  • 4.2 本体构建方法描述
  • 4.2.1 本体规划
  • 4.2.2 本体分析、设计
  • 4.2.3 本体实现
  • 4.2.4 本体评价
  • 4.2.5 本体建立与维护
  • 4.2.6 循环改进与扩展
  • 4.3 本体具体实现
  • 4.3.1 实现工具
  • 4.3.2 实现算法
  • 4.3.3 本体结构
  • 4.4 本章小结
  • 第五章 社会网络抽取算法实现
  • 5.1 算法描述
  • 5.2 社会网络抽取过程中的关键问题
  • 5.3 数据库部署
  • 5.3.1 Oracle数据库简介
  • 5.3.2 数据预处理
  • 5.4 算法实现解决方案
  • 5.4.1 实现总体设计
  • 5.4.2 实现详细设计
  • 5.5 算法评价
  • 5.6 本章小结
  • 第六章 实验结果与分析
  • 6.1 实验环境及数据集
  • 6.2 实验参数及分析
  • 6.2.1 时间性能实验
  • 6.2.2 召回率性能实验
  • 6.3 本章小结
  • 第七章 结束语
  • 7.1 本文的主要贡献
  • 7.2 一些主要结论
  • 7.3 进一步的工作
  • 参考文献
  • 致谢
  • 攻读硕士期间参加的项目及发表的论文
  • 相关论文文献

    标签:;  ;  ;  ;  ;  ;  

    基于本体的可伸缩的社会网络抽取算法的研究
    下载Doc文档

    猜你喜欢