Print

编辑距离及其在Penna模型中的应用

论文摘要

编辑距离是A.Levenshtein于1966年提出的,用于判断字符串之间相似程度,等于将一个字符串通过基本变换转化为另一个字符串所需的最小代价。和Hamming距离不同,编辑距离可以计算的不同长度字符串之间的相似度。编辑距离目前在语言学,生物学领域都得到了广泛的应用。T.J.P.Penna于1995年提出的Penna模型是一个单物种种群演化模型。Penna模型用32位的二进制字符串表示个体基因,利用计算机可以快速的进行大规模种群的模拟,已被广泛应用于研究各种种群动态问题。例如,引入实际参数的Penna模型可以用来指定捕虾策略,可以保证在不降低利润的情况下最大程度的扩大红龙虾的种群规模。利用Penna模型找出北极鳕鱼的消亡原因,模拟阿拉斯加狼群的发展等。Penna模型是现阶段具有年龄结构的最成功的生物演化模型。本文首先介绍了编辑距离和Penna模型基本概念及其具体应用,然后将编辑距离引入Penna模型中,创建了基于编辑距离的Penna模型,该模型具有标准Penna模型的基本性质,但具备更灵活的变异方式,并可以进一步扩展来模拟基因长度变化的种群。最后,本文利用平均编辑距离(AverLD)的概念研究了种群规模稳定后种群基因的发展规律,发现在无变异的情况下平均编辑距离收敛为0,即所有个体的基因趋同;在有变异的情况下平均编辑距离收敛为一大于0的常数。

论文目录

  • 摘要
  • Abstract
  • 引言
  • 1 编辑距离
  • 1.1 编辑距离的定义
  • 1.2 编辑距离与Hamming距离的比较
  • 1.3 编辑距离的应用
  • 1.3.1 编辑距离下的串联重复
  • 1.3.2 编辑距离其它的应用
  • 2 Penna模型
  • 2.1 无性繁殖的Penna模型
  • 2.2 有性繁殖的Penna模型
  • 2.3 Penna模型的应用
  • 2.3.1 Penna模型与德国人口
  • 2.3.2 用Penna模型模拟棉蚜虫种群的发展
  • 2.3.3 Penna模型其它的应用
  • 3 基于编辑距离的Penna模型
  • 4 在编辑距离意义下,Penna模型的收敛性
  • 4.1 Penna模型的平均编辑距离
  • 4.1.1 无变异的标准Penna模型的平均编辑距离
  • 4.1.2 有变异的标准Penna模型的平均编辑距离
  • 4.1.3 基于编辑距离的Penna模型的平均编辑距离
  • 4.2 无变异情况下Penna模型的基因种类
  • 4.3 有变异情况下Penna模型的平均编辑距离补充
  • 结论
  • 参考文献
  • 攻读硕士学位期间发表学术论文情况
  • 致谢
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/a0e1cabac576527d67d44260.html