编辑距离是A.Levenshtein于1966年提出的,用于判断字符串之间相似程度,等于将一个字符串通过基本变换转化为另一个字符串所需的最小代价。和Hamming距离不同,编辑距离可以计算的不同长度字符串之间的相似度。编辑距离目前在语言学,生物学领域都得到了广泛的应用。T.J.P.Penna于1995年提出的Penna模型是一个单物种种群演化模型。Penna模型用32位的二进制字符串表示个体基因,利用计算机可以快速的进行大规模种群的模拟,已被广泛应用于研究各种种群动态问题。例如,引入实际参数的Penna模型可以用来指定捕虾策略,可以保证在不降低利润的情况下最大程度的扩大红龙虾的种群规模。利用Penna模型找出北极鳕鱼的消亡原因,模拟阿拉斯加狼群的发展等。Penna模型是现阶段具有年龄结构的最成功的生物演化模型。本文首先介绍了编辑距离和Penna模型基本概念及其具体应用,然后将编辑距离引入Penna模型中,创建了基于编辑距离的Penna模型,该模型具有标准Penna模型的基本性质,但具备更灵活的变异方式,并可以进一步扩展来模拟基因长度变化的种群。最后,本文利用平均编辑距离(AverLD)的概念研究了种群规模稳定后种群基因的发展规律,发现在无变异的情况下平均编辑距离收敛为0,即所有个体的基因趋同;在有变异的情况下平均编辑距离收敛为一大于0的常数。
本文来源: https://www.lw50.cn/article/a0e1cabac576527d67d44260.html