论文摘要
在对专业领域社会网络的抽取过程中涉及很多大数据集,将社会网络的抽取应用到一个大的组织(用户群)的时候,提交到搜索引擎中的关键字的数目成为了一个关键性的问题。由于需要将所有结点进行完全配对搜索和计算,大数据集和多关键字在时间和空间上开销太大,因此研究人员提出用部分计算的方法确定结点间关系,从而出现了社会网络抽取的可伸缩性问题。对于社会网络抽取可伸缩性问题的研究,虽然许多学者提出了一些能够有效地降低计算时间和存储空间的解决方法,但仍存在结果准确性敏感于阈值设置等客观条件的问题,即运算的准确度随着客观条件的改变而产生很大差异。本文提出一种基于本体的、具有可伸缩的实现社会网络抽取算法Ontology-Scalability,该算法应用本体进行相关领域数据存储并减少搜索引擎中需检索的关键字数目,从而提高网络中结点关系的计算和存储效率。本文首先介绍了社会网络定义及相关概念、社会网络分析在计算机科学领域中的应用,之后对现有的社会网络抽取算法进行了归纳,并对其中的代表算法作了简要的分析。本文重点讨论了本体的构建,给出了支持社会网络分析的本体的构建方法,在此基础上提出了一个基于本体的、具有可伸缩的社会网络抽取算法,文中详细描述了算法的思想、实现过程及性能评价。本文的算法计算时间复杂度由传统算法的O(n2)降低为O(n),实验表明该算法相较于传统算法在时间性能上有很大提高。它具有对大数据集的数据进行社会网络抽取时间短、召回率(准确率)高等优点。更重要的是,算法中构建的本体是通过领域性的数据构建,可以重复利用在不同的系统中。
论文目录
摘要ABSTRACT第一章 绪论1.1 社会网络概述1.1.1 社会网络概念1.1.2 社会网络划分1.1.3 社会网络表示1.2 社会网络分析与应用1.2.1 社会网络分析概念1.2.2 社会网络分析应用1.3 问题提出1.4 课题来源1.5 全文组织结构第二章 相关技术及研究背景2.1 相关概念2.1.1 语义Web概述2.1.2 本体概述2.1.3 本体在社会网络分析的作用2.2 相关工作2.3 研究背景2.4 本章小结第三章 社会网络抽取算法分析3.1 传统算法及分析3.2 改进算法及分析3.3 本文的改进思路3.4 本章小结第四章 支持社会网络分析的本体构建4.1 本体简述4.1.1 本体概念4.1.2 本体分类4.1.3 本体构建原则、步骤和方法4.2 本体构建方法描述4.2.1 本体规划4.2.2 本体分析、设计4.2.3 本体实现4.2.4 本体评价4.2.5 本体建立与维护4.2.6 循环改进与扩展4.3 本体具体实现4.3.1 实现工具4.3.2 实现算法4.3.3 本体结构4.4 本章小结第五章 社会网络抽取算法实现5.1 算法描述5.2 社会网络抽取过程中的关键问题5.3 数据库部署5.3.1 Oracle数据库简介5.3.2 数据预处理5.4 算法实现解决方案5.4.1 实现总体设计5.4.2 实现详细设计5.5 算法评价5.6 本章小结第六章 实验结果与分析6.1 实验环境及数据集6.2 实验参数及分析6.2.1 时间性能实验6.2.2 召回率性能实验6.3 本章小结第七章 结束语7.1 本文的主要贡献7.2 一些主要结论7.3 进一步的工作参考文献致谢攻读硕士期间参加的项目及发表的论文
相关论文文献
标签:社会网络论文; 可伸缩性论文; 结点关系论文; 本体论文; 语义论文; 搜索引擎论文;