论文摘要
串匹配是计算机科学中一个基本、重要的研究问题。多目标和多模式匹配是串匹配技术的重要研究内容。多目标和多模式精确串匹配技术要求目标串(正文串)与查询串(模式串)完全一致匹配。但是,在很多实际应用中,并不要求目标串与模式完全精确匹配,于是引入了多目标和多模式近似串匹配技术。许多应用的正文串(目标串)的规模往往很大,需要设计高效的多目标和多模式近似匹配并行算法来快速求解这类问题。机群系统具有高性能、低成本、可扩展性好的特点。本文将在处理机节点具有不同计算速度、不同通信延迟、不同存储容量的异构机群系统上,设计、实现高效的多目标和多模式精确与近似串匹配并行算法,并分析和测试并行算法的性能。运用基于孙子定理构造的均匀Hash函数并继承Karp-Rabin模式匹配思想,通过“筛选”方法,给出一种机群系统上多目标串精确匹配并行算法。该算法将字符串映射成惟一的一对整数值并采用比较一对整数值来取代逐个字符比较模式和目标串的方法,使得比较过程快速且匹配结果是确定的。算法分析和实验结果表明该并行算法简明、高效和可扩展。针对处理机节点具有不同的计算速度、通信延迟和存储容量的情形,考虑计算和通信启动开销,给定处理机分配顺序,基于可分负载理论,分别建立单层和两层树结构模型的存储受限异构机群系统的目标串最优分配线性规划模型,给出相应的目标串最优分配方法,并讨论了处理机最优分配顺序。异构PC机群系统上的实验结果表明,本文提出的基于最优分配方法的多目标串近似匹配并行算法优于平均分配算法,获得了接近线性的加速,具有良好的可扩展性。对于给定的正文串和多个模式串,运用均匀Hash函数将所有模式串的签名映射成惟一的一对整数值并存储于Hash表中,给出正文串窗口签名Hash值的推算公式;在节点具有不同的计算速度、通信延迟、存储容量的异构机群系统上,考虑计算和通信启动开销,基于可分负载理论,建立正文串最优分配线性规划模型,提出一种允许1个错误字符的多模式近似匹配并行算法。异构PC机群系统上的实验结果表明,该算法获得了较好的加速和可扩展性,它比基于均匀分配正文串策略的多模式近似匹配并行算法平均快25%。
论文目录
摘要Abstract第一章 绪论1.1 串匹配及其应用1.2 多目标串和多模式近似匹配1.2.1 多目标串和多模式近似匹配问题1.2.2 编辑操作与距离函数1.2.3 编辑距离的计算1.3 多目标串和多模式近似匹配并行算法研究现状1.3.1 多目标串近似匹配串行和并行算法研究进展1.3.2 多模式近似匹配串行和并行算法研究综述1.4 论文选题的目的和意义1.5 论文的主要研究内容和论文的组织第二章 并行计算理论基础2.1 并行计算概述2.2 当代并行计算机体系结构2.3 并行计算模型2.4 并行算法基础知识2.4.1 并行算法的定义和分类2.4.2 并行算法的复杂性度量2.4.3 并行算法的性能评价2.5 机群计算系统2.5.1 机群系统的概念2.5.2 机群系统的分类2.5.3 机群系统的关键技术2.5.4 机群系统的发展现状第三章 机群系统上基于Hashing的多目标串匹配并行算法3.1 引言3.2 Hash函数及均匀Hash函数的构造3.3 机群系统上多目标串匹配并行算法3.4 实验3.5 本章小结第四章 存储受限异构机群系统的多目标串近似匹配并行算法4.1 引言4.2 可分负载理论与异构机群系统的多目标串近似匹配问题4.3 多目标串最优分配方法4.3.1 单层树结构模型的存储受限异构机群系统的多目标串最优分配方法4.3.2 两层树结构模型的存储受限异构机群系统的多目标串最优分配方法4.3.3 处理机最优分配顺序4.4 实验4.4.1 实验环境4.4.2 实验结果4.4.3 可扩展性分析4.5 本章小结第五章 异构机群系统上的多模式近似匹配5.1 引言5.2 MultiHash算法5.3 模式串处理和正文窗口签名Hash值的计算5.3.1 模式串并行处理5.3.2 正文窗口签名Hash值的计算5.4 正文串最优分配方法5.5 允许1个错误字符的多模式近似匹配并行算法5.6 实验5.6.1 实验环境5.6.2 实验结果5.7 本章小结第六章 总结6.1 本文的主要工作6.2 本文的贡献与创新之处6.3 下一步的工作参考文献致谢攻读硕士学位期间参加的科研项目攻读硕士学位期间发表/录用的学术论文
相关论文文献
标签:多目标串近似匹配论文; 多模式近似匹配论文; 异构机群系统论文; 并行算法论文; 可分负载论文; 存储受限论文;
异构机群系统上多目标和多模式近似串匹配并行算法研究
下载Doc文档