论文摘要
染色体识别一直是细胞遗传学的重要课题,并在染色体综合症诊断等方面有着广泛的应用价值。传统染色体识别由人工完成,不仅识别过程繁琐,而且识别率低。自1960年代末起,国际上就展开了染色体自动识别的研究,并出现多种染色体自动识别系统。染色体的自动识别是模式识别、机器视觉和人工智能等诸多领域研究的热点问题,其研究成果对于生物细胞学、遗传学和临床医学应用有重大价值,因此长期以来一直受到人们的关注。已有的染色体自动识别系统虽已应用,但是通常要求很高的样品质量,或者在识别的过程中进行人机交互操作。而实际的研究和临床工作中采集图像过程往往受到许多随机因素的影响,图片质量难以达到目前系统的要求,这样识别正确率就会大大降低,因此目前的识别系统还并不能称为真正意义的“自动”识别系统。尤其目前随着临床医学迅猛发展,对染色体自动识别的正确率和效率也越来越高,使得已有的识别系统难以应付。早期染色体的染色体识别多采用统计的方法,随着人工智能、计算机视觉等兴起,以及生理学、神经生物学、心理学等对人类视觉研究的深入,后来引入了人工神经元网络,近来又引入了模糊理论;此外新的染带制作方法的提出,计算机硬件不断发展,也促使识别的准确率有很大提高,但一直都没有达到令人满意程度。本文对已有的染色体图像采集过程和染色体图像处理分析过程进行研究。认为造成识别率难以提高的两个主要原因是:(1)由于显微镜背景灯照明不均匀,影响独立染色体提取的准确率:(2)在以往常用染色体长度、着丝粒系数和带纹作为分类依据,但是由于部分染色体长度、着丝粒系数接近,而且染带过程和图像处理使得着丝粒不是分明显,带纹由于相互叠加也常常不清晰。本文基于以上两点不足,提出动态阈值算法和特征带概念。使用提出动态阈值算法处理染色体图像,使由于光照不均一造成的独立染色体分割的准确率提高;特征代的概念是根据人工识别染色体的过程提出,使用染色体特征带并与先前的着丝粒系数和染色体长度一起作为识别依据来识别染色体,使识别的染色体,尤其是长度和着丝粒系数相近的染色体识别的准确率提高。同时本文对于骨架提取也作了一些改进,使之更接近理想骨架。最后我们采集了一些染色体图像,经过对5组染色体图像的分析并与传统的方法比较,本文方法可以较好的处理光照不均以图像,染色体识别准确率也有了一定的提高,尤其是长度、着丝粒系数接近的染色体。