论文摘要
硒是人及哺乳动物必需的一种微量元素。硒参与甲状腺激素代谢、抗氧化系统和机体免疫功能的正常发挥。在原核生物、真核生物和古细菌中都发现有硒蛋白的存在,其中哺乳动物硒蛋白现已发现近30种。但是,植物硒蛋白的研究相对滞后,迄今为止仅见于衣藻硒蛋白的报道。高等植物中硒蛋白是否存在的问题,迄今尚未有明确答案。因此应用生物信息学的研究手段,对高等植物中可能存在的硒蛋白线索进行找寻和分析,在理论研究和实际应用中都具有重要意义。本文第一部分综合总结归纳了硒蛋白领域的研究方法和相关成果,对目前植物硒蛋白研究停滞不前的原因进行了分析。在此基础上,精心设计研究路线和方法,选取硬粒小麦Durum Wheat为研究对象,综合利用生物信息学手段,对硬粒小麦Durum Wheat中可能存在的硒蛋白进行了探索性研究。鉴于目前已发现的硒蛋白均具有SECIS特征结构,首先对Genbank中的Durum Wheat表达核酸序列进行逐一筛选,找到其具有SECIS的序列,共发现47个具有SECIS特征结构的目标序列。通过进一步分析和筛选,确定以数据量完整的AY146587.1序列及其互补序列为进一步的研究目标。应用Vector NT等工具对目标序列和衣藻硒蛋白进行综合比较分析,最终在目标序列发现一段与衣藻硒蛋白具有较高的结构相似性的表达区段,并在此基础上研究分析该目标序列编码硒蛋白(或同源物)的可能性。针对上述表达区段没有发现TGA碱基区的问题,再次对目标序列进行了更为全面的搜索和分析研究,又发现另一段同时具有与衣藻硒蛋白相似结构特征和TGA碱基区的序列段。这2段表达区位置临近并且有交集,都位于GENSCAN预测得到的基因段内。将上述2段序列作为目标对象,以其翻译后氨基酸序列的结构特征为突破口,利用现有蛋白质数据库和分析工具进行了大量的研究分析,发现了具有意义的生物信息线索,这些线索均显示目标序列可能具有和动物硒蛋白相似的功能。综合分析上述研究结果,认为在目标序列中这一表达区段范围内,存在硒蛋白的可能性很大,并推测其功能作用与硬粒小麦Durum Wheat胚胎发育时期能量调节相关。同时在研究过程中发现,完全依赖基于现有知识的生物信息学分析工具和方法对高等植物可能具有的硒蛋白进行研究,局限性很大,这与动物硒蛋白研究领域的情况有很大不同。结合本课题研究的结果,综合分析目前植物硒蛋白研究领域现状,提出合理的解释和推断:高等植物中存在功能与动物硒蛋白相似的硒蛋白,但其具有与动物硒蛋白不同的编码机理,甚至不能排除高等植物中存在未知氨基酸的可能性。正是由于这个原因,导致了在硒蛋白研究成果领域中动物和植物的迥然不同。本论文第一部分阐述的研究成果一方面在高等植物硒蛋白研究领域中取得有意义的发现和突破;另一方面也提出了大胆的设想和推测,为今后高等植物硒蛋白研究提供了新的思路和方法。本文第二部分主要针对当前生物试验中高通量筛选的实际需要,同时也考虑到今后植物硒蛋白生物验证试验中可能出现的高通量筛选需求,利用图论方法,建立了一个高效准确的筛选策略模型,并编制程序实现。通过分析,确定了最佳分组大小与所需次数及提高效率的关系,并对该策略模型进行生物学验证,从而建立了一种准确快速的筛选方法。该筛选方法相对于单个检测速度能提高10-100倍。该方法在具体操作中可根据实际情况灵活处理,通过调整分组大小,利用程序计算出需要检测次数的上界,作为实验的有利参考。利用这种方法能在92次PCR次数之内从1000个植株材料中快速准确地筛选出10个阳性的转基因植株。此方法为植物基因工程大量无标记基因转化后代的快速筛选提供了条件,并对涉及从M个样品中寻找N个目标的实验有一定的指导作用。