论文摘要
由于对等网上数据的分布性、无结构化和缺乏面向语义的表达与描述,导致其检索效率低下,检索成本也随着网络信息量的飞速增加而爆炸性增长。大众标注是在Web2.0时代出现的一种新的资源组织方式,它有助于形成网络资源及用户社区,能够降低信息检索的成本,而且大众标注本身带有一定的语义性,将其应用到P2P环境下的语义检索能为分布式信息的语义检索研究带来新的启示。因此,本文主要研究基于大众标注的对等网语义检索系统模型。首先,收集整理中国知网、万方数据库关于对等网信息检索的相关文献及对32届ACM SIGIR信息检索大会的论文主题分析,归纳总结了基于大众标注的对等网语义检索系统模型的国内外研究现状,指出对等网语义检索系统模型的研究是近年来国内外信息检索领域研究的热点之一,基于大众标注的对等网语义检索系统研究是一个新的研究方向。接着,利用大众标注能够体现用户语义、有助于形成用户及资源社区等特性,研究了在P2P混合模型下,基于大众标注的社区资源和社区用户管理机制,构建了基于大众标注的P2P语义检索系统模型,并详细阐述了系统的各模块功能和检索流程,重点探讨了其中资源搜索模块的两种搜索方法。最后,针对系统模型的标签处理模块,引入著名的Porter算法(The porter stemming algorithm)对英文标签进行词根提取,在此基础上提出了可以根据用户需要进行精度选择的英文标签聚类算法,并利用标签云进行了模拟实验。实验表明,采用此聚类算法有利于根据用户的需要组织标签并更准确地描述资源。
论文目录
相关论文文献
- [1].大众标注网站服务功能与运营模式分析[J]. 图书情报工作 2008(01)
- [2].图书大众标注评介——以豆瓣网为例[J]. 图书馆杂志 2009(02)
- [3].网络标注的文化属性及功能[J]. 黑龙江科技信息 2013(32)
- [4].基于PLSA的大众标注资源主题挖掘[J]. 现代图书情报技术 2010(03)
- [5].基于特征加权张量分解的标签推荐算法研究[J]. 江苏科技大学学报(自然科学版) 2015(06)
- [6].基于K-means聚类与张量分解的社会化标签推荐系统研究[J]. 江苏科技大学学报(自然科学版) 2012(06)
- [7].大众标注系统中基于本体的语义检索研究综述[J]. 现代图书情报技术 2011(03)
- [8].基于大众标注的主动交互式E-learning探讨[J]. 中国科教创新导刊 2009(32)
- [9].基于用户协作的非物质文化遗产数字资源分类模式研究[J]. 现代情报 2017(03)
- [10].基于大众标注的层次信息可视化算法研究[J]. 现代图书情报技术 2014(Z1)
- [11].基于大众标注技术的网站信息构建研究[J]. 图书情报工作 2011(03)
- [12].标注及其演化研究[J]. 图书情报工作 2008(01)