双排序互关联后继树模型的若干应用研究

双排序互关联后继树模型的若干应用研究

论文摘要

随着互联网的飞速发展,信息量的指数增长,人们很难在海量的信息中快速找到符合自己需求的信息。全文数据库的出现,大大改善了这一现状。目前比较常见和流行的全文检索模型有以下几种模型:署名文件(Signature Files)、位图(Bit Map)、倒排表(Inverted List)、∑~2矩阵Pat树和Pat数组等等,它们均有各自的局限性。互关联后继树模型是从中文语言特点出发提出的一种新颖的全文检索模型,它具有创建速度快,查询速度快,空间效率高等特点,并且可以通过索引生成原文。从提出至今,在复旦大学老师和几届学生的努力下,互关联后继树模型已经有了很大的发展。从最初的基本模型,到三元模型,再到后继有序模型,其创建、查询效率都已经有了不小的提高。作为一个优秀的全文检索模型,它被广泛应用于频繁项集挖掘、关联规则挖掘、文本过滤、概念格、时间序列特征模式挖掘等领域。互关联后继树模型的最新研究成果是双排序互关联后继树,具有高效的创建和查询算法。本文正是以双排序互关联后继树为基础,进一步研究其在最长公共子串查找和频繁项集挖掘等领域的应用。本文研究内容和创新工作主要包括以下两个方面:1)基于双排序互关联后继树的最长公共子串查找。目前常见的最长公共子串查找方法有:基于动态规划的LCS查找算法、基于广义后缀树的LCS查找算法和基于广义后缀数组的LCS查找算法。本文基于双排序互关联后继树,利用其优良特性,提出了一种全新的LCS查找算法,进一步扩展了互关联后继树模型的应用领域。相比于基于广义后缀树的LCS查找算法,该算法具有创建速度快,空间效率高,查询效率高等特点。2)基于双排序互关联后继树的频繁项集挖掘。互关联后继树模型应用于频繁项集挖掘的研究早已开始。本文在双排序互关联后继树的基础上,结合原文,提出了一种新的基于全文和双排序互关联后继树的获取直接项集算法,然后根据直接项集发现间接项集,合并后根据最小支持度得到频繁项集。随后改进了获取间接项集算法,是双排序IRST在频繁项集挖掘中的一种尝试。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1 研究背景
  • 1.2 研究现状
  • 1.3 论文的组织
  • 第二章 双排序互关联后继树模型研究
  • 2.1 双排序互关联后继树模型简介
  • 2.1.1 互关联后继树模型
  • 2.1.2 双排序互关联后继树模型
  • 2.2 双排序互关联后继树的创建算法
  • 2.3 双排序互关联后继树后继区间二分搜索算法
  • 2.3.1 正向和逆向搜索算法
  • 2.3.2 时间复杂度比较
  • 第三章 最长公共子串研究
  • 3.1 引言
  • 3.2 基于动态规划的LCS查找算法
  • 3.3 基于后缀链的广义后缀树的LCS查找算法
  • 3.3.1 广义后缀树及基于后缀链的Ukkonen算法
  • 3.3.2 基于后缀链广义后缀树的最长公共子串查找算法
  • 3.4 基于广义后缀数组的LCS查找算法
  • 3.4.1 广义后缀数组
  • 3.4.4 计算所有最长公共子串
  • 3.5 基于双排序互关联后继树的LCS查找算法
  • 3.5.1 创建双排序IRST树
  • 3.5.2 LCS查找算法
  • 3.5.3 实验
  • 第四章 频繁项集挖掘的研究
  • 4.1 引言
  • 4.2 典型频繁项集挖掘算法
  • 4.2.1 关联规则基本概念
  • 4.2.2 频繁项集挖掘算法分类
  • 4.3 基于双排序IRST和全文的频繁项集挖掘算法
  • 4.3.1 创建双排序IRST树
  • 4.3.2 频繁项集挖掘算法
  • 第五章 总结与展望
  • 5.1 总结
  • 5.2 展望
  • 参考文献
  • 硕士学位期间参与的科研项目及主要成果
  • 致谢
  • 相关论文文献

    • [1].基于互关联后继树的数学表达式检索[J]. 计算机工程 2017(06)
    • [2].尊重[J]. 德语人文研究 2019(02)
    • [3].后继序列有序的互关联后继树创建和搜索算法[J]. 计算机应用与软件 2008(04)
    • [4].基于互关联后继树的多库合并建库算法[J]. 计算机应用与软件 2008(04)
    • [5].基于帧间双向互关联的点状多目标检测算法[J]. 计算机工程与应用 2008(27)
    • [6].基于双排序互关联后继树的索引压缩和原文生成算法[J]. 计算机应用与软件 2010(09)
    • [7].二元互关联后继树精简索引模型研究[J]. 小型微型计算机系统 2011(02)
    • [8].周期调制互关联双态噪声驱动欠阻尼谐振子系统的随机共振[J]. 通化师范学院学报 2009(10)
    • [9].基于三元互关联后继树的Web日志挖掘[J]. 计算机应用与软件 2011(10)
    • [10].周期调制互关联双态噪声驱动过阻尼谐振子系统的随机共振[J]. 广西物理 2009(02)
    • [11].现代的“迷信”和传统的“祛魅”[J]. 读书 2014(06)
    • [12].企业需要未雨绸缪的三大科技趋势[J]. 信息安全与通信保密 2011(08)
    • [13].“大我”、“小我”[J]. 长江师范学院学报 2009(03)
    • [14].英语教学应注重语言文化的渗透[J]. 宁夏教育 2009(12)
    • [15].一种时序数据间断频繁项挖掘算法[J]. 科技视界 2013(06)
    • [16].产城融合背景下产业集聚区发展建设研究[J]. 科技信息 2013(22)
    • [17].电商法有望成消费者维权利器[J]. 检察风云 2018(23)
    • [18].几道高考立几题的定量分析[J]. 中学数学研究 2011(09)
    • [19].不能不知的几种解题方法[J]. 中学生数理化(高一版) 2010(05)
    • [20].中国“工业4.0”亟待突围[J]. 资本市场 2015(03)
    • [21].随机双指数记忆耗散系统的非马尔可夫扩散[J]. 物理学报 2013(08)
    • [22].产业集群与区域经济发展探析[J]. 特区经济 2011(03)
    • [23].推进产业集聚 实现科学发展[J]. 群众 2008(04)
    • [24].以生态学思维引领教育综合改革[J]. 中国教育学刊 2014(12)
    • [25].经济增长源泉与中华民族复兴[J]. 世界经济与政治 2013(01)
    • [26].大数据带来大商业价值[J]. IT经理世界 2011(23)
    • [27].简论后理性认识[J]. 党政干部学刊 2009(01)
    • [28].军事软实力与军队政治工作关系辨析[J]. 湖北经济学院学报(人文社会科学版) 2009(02)
    • [29].关于“人”的功课[J]. 建筑技艺 2015(05)
    • [30].色关联的乘性和加性色噪声激励下分段非线性模型的随机共振[J]. 物理学报 2014(21)

    标签:;  ;  ;  

    双排序互关联后继树模型的若干应用研究
    下载Doc文档

    猜你喜欢