小麦全长cDNA文库构建、测序与分析

小麦全长cDNA文库构建、测序与分析

论文摘要

作物基因组学是当今最重要的研究领域。小麦是世界上最重要的粮食作物之一,但普通小麦(T.aestivum)为异源六倍体(AABBDD),基因组庞大(1.6×1010bp),重复序列多(约90%),目前还难以通过全基因组测序进行小麦功能基因组研究。全长cDNA克隆不仅包含完整的阅读框,还拥有5′和3′端的非编码区,是进行高通量的功能基因组学研究的一条有效途径。 在引进、消化吸收的基础上,我们对Cap-trapper法做了进一步的改进,形成了一套简单易行的技术体系,建立了我们自己的全长cDNA文库构建技术平台。利用改进的Cap-trapper法,分别构建了不同倍性、不同组织、不同处理的小麦全长cDNA文库10个,涉及普通小麦(AABBDD)及其三个二倍体祖先种(AA、SS和DD)和四倍体波斯小麦(AABB)共计小麦的5个种,涉及幼苗、根、愈伤组织、花药、胚乳,并设有白粉菌诱导诱导与对照等。所建文库插入片段平均为1.5kb左右,原始文库的库容量在6.0×105~5.0×106pfu之间,经后期测序并与GenBank公布的小麦全长mRNA序列比对分析表明克隆的全长比例为93%左右,扩增文库滴度在1010pfu/ml数量级,适合于大规模测序需要,是开展小麦功能基因学研究的宝贵资源。 试验从10个全长cDNA文库随机挑取大约11万个克隆进行3’端测序,获得106,671条3’端EST,去除冗余后选择代表性克隆进行了克隆5’端测序,获得31,732条5’EST,共获得138,403条EST,得到高质量序列(Q20)数据7.46×107bp。在去除ployA和短于100bp的序列后获得5’EST和3’EST分别为30,586条和95,736条。经cap3软件聚类分析表明试验获得了32,899条不重复克隆。 GC含量统计表明小麦族基因cDNA序列中GC含量为54.0%,这与水稻基因组GC含量基本一致(53.4%),而与拟南芥有明显差别(40.7%);5’和3’EST比较发现5’端GC含量为57.80%,明显高于3’的GC含量(52.8%)。推测小麦基因的这种高GC含量特别是5’端高GC含量是小麦全长基因克隆和测序困难的原因之一。 将获得的32,899条不重复序列使用blast软件将比对参数E值设为le-20对879,695条小麦公共EST数据进行相似性搜索,结果表明8,800条为新的小麦EST(26,75%);使用参数1e-5对水稻32,127条全长cDNA序列比对结果表明15,992条(48.6%)序列在水稻全长cDNA中没有对应序列。同时,利用1e-20的参数对水稻1,191,102条水稻EST数据blast结果表明18,672条没有相应序列(56.75%);用该数据集对华大基因组研究所测序的水稻基因组序列blastn搜索结果表明14,382条(43.72%)在水稻基因组序列中没有对应序列(E-value 1e-5)。 密码子使用的偏爱性是生物在长期进化过程中逐渐形成的,影响偏爱性的因素有多种,如G+C含量,基因表达水平,基因的长度,tRNA的丰度等等。我们随机挑取了750条全长序列使用codonW软件对小麦密码子使用偏爱性进行了分析,统计结果表明小麦基因密码子第三位GC含量为54%左右,与表达基因的整体GC含量一致;同时发现小麦优先使用的密码子27个,所有优先使用的密码子均以G或者C结尾,无一例外,这与水稻的情况非常一致;而拟南芥为低GC含量物种,仅为44%,所有优先使用的密码子均以A或者T结尾。说明植物进化过程中单双子叶植物分开后首先GC含量趋异非常明显,进而密码子优先使用特性也完全不同。 使用基于Linux平台的本地化分析平台系统对获得32,899条序列进行了分子功能、生物过程和细胞组分三个层次的Gene Ontology注释,获得了小麦基因的多层次注释信息。

论文目录

  • 第一章 绪论
  • 1.植物功能基因组学研究进展
  • 1.1 基因组学的概念
  • 1.2 植物功能基因组学概述
  • 1.3 植物功能基因组学主要研究内容
  • 1.4 植物功能基因组学研究现状与发展趋势
  • 1.5 植物功能基因组学研究技术与方法
  • 1.6 小麦基因组学研究现状
  • 2.EST技术研究进展
  • 2.1 EST的概念
  • 2.2 EST的应用
  • 2.2.1 用于基因表达分析和新基因的发掘
  • 2.2.2 基因组作图
  • 2.2.3 基因表达差异的研究
  • 2.2.4 用于制备DNA芯片
  • 2.2.5 寻找其它序列特征
  • 2.3 重要农作物EST研究进展
  • 3 全长cDNA与全长cDNA文库的构建
  • 3.1 普通cDNA文库
  • 3.2 差减文库
  • 3.2.1 差减文库的原理
  • 3.2.2 差减cDNA文库的构建方法
  • 3.3 均一化cDNA文库
  • 3.4 全长cDNA文库
  • 3.4.1 全长cDNA文库的特点
  • 3.4.2 构建全长cDNA文库的方法及原理
  • 3.4.3 重要生物全长cDNA克隆与测序研究进展
  • 4 生物信息学研究进展
  • 4.1 生物信息学产生背景
  • 4.2 生物信息学概念
  • 4.3 生物信息学研究内容
  • 4.4 生物信息学的应用
  • 4.4.1 序列对比
  • 4.4.2 新基因的发现和鉴定
  • 4.4.3 基因组序列信息的提取和分析
  • 4.4.4 蛋白质结构和功能的预测
  • 4.4.5 分子进化研究
  • 4.4.6 利用生物信息学软件寻找候选分子标记
  • 4.4.7 电子拼接
  • 5 密码子使用偏爱性研究进展
  • 6 普通小麦的分类、起源与多倍体特性
  • 6.1 小麦的分类
  • 6.2 普通小麦的基因组起源
  • 6.3 小麦基因组起源研究方法
  • 6.4 小麦基因组起源研究的对象
  • 6.5 小麦的多倍体特性
  • 7 实验设计
  • 7.1 立项背景
  • 7.1.1 小麦的起源与演化
  • 7.1.2 大批量全长cDNA克隆是功能基因组学研究的重要战略资源
  • 7.2 研究目的与实验内容
  • 7.3 技术路线
  • 第二章 小麦全长cDNA文库构建
  • 1 材料与方法
  • 1.1 试验材料
  • 1.1.1 文库构建所用的小麦材料
  • 1.1.2 化学试剂、酶类以及试剂盒
  • 1.1.3 引物
  • 1.2 试验方法
  • 1.2.1 总RNA提取
  • 1.2.2 mRNA分离纯化
  • 1.2.3 第一链cDNA合成
  • 1.2.4 生物素标记
  • 1.2.5 全长cDNA的捕获
  • 1.2.6 末端转移酶加poly(G)
  • 1.2.7 第二链合成
  • 1.2.8 BsaⅠ酶切
  • 1.2.9 cDNA纯化与分级
  • 1.2.10 连接
  • 1.2.11 包装
  • 1.2.12 原始文库滴度检测
  • 1.2.13 原始文库的扩增
  • 1.2.14 噬粒环化
  • 1.2.15 cDNA文库的单克隆保存
  • 1.2.16 质粒文库的复制
  • 1.2.17 质粒提取(96孔培养板)
  • 1.2.18 测序
  • 1.2.19 全长cDNA判别
  • 2 结果分析
  • 2.1 全长cDNA文库构建结果
  • 2.1.1 总RNA提取及mRNA的分离纯化
  • 2.1.2 cDNA文库滴度检测及库容量计算
  • 2.1.3 插入片段检测
  • 2.1.4 扩增文库的滴度检测
  • 2.1.5 ABI 3730 XL DNA Analyzer测序体系确定
  • 3 讨论
  • 3.1 mRNA质量是构建高质量全长cDNA文库的基础
  • 3.2 关于全长库构建方法的选择
  • 3.3 对Cap-Trapper法的改良
  • 1) 关于反转录引物选择
  • 2) 关于全长cDNA定向克隆问题
  • 3) 关于克隆插入方向问题
  • 4) 关于文库构建流程简化问题
  • 5) 关于构建过程中同位素示踪问题
  • 6) 关于蓝白斑选择问题
  • 本章结论
  • 第三章 小麦全长cDNA克隆大规模测序和序列的初步分析
  • 3.1 概述
  • 3.1.1 本研究整体思路
  • 3.1.2 研究目标
  • 3.1.3 研究工作流程
  • 3.1.4 本地化生物信息分析平台构建
  • 3.2 结果与分析
  • 3.2.1 全长cDNA文库大规模测序
  • 3.2.2 cDNA文库全长比例分析
  • 3.2.3 大批量测序数据预处理
  • 3.2.4 基于大规模全长cDNA序列的小麦基因GC含量分析
  • 3.2.5 小麦基因密码子使用偏性分析
  • 3.2.6 克隆的小麦全长cDNA中新基因的确定
  • 3.2.7 小麦EST数据的GO注释
  • 3.2.8 粗山羊草叶和根中差异表达基因分析
  • 3.2.9 中国春可育花药与败育花药基因表达差异分析
  • 3.2.10 不同倍性小麦基因表达特性
  • 4.讨论
  • 4.1 关于重要物种全长cDNA克隆测序项目研究进展
  • 4.2 关于本研究中全长cDNA文库和全长cDNA序列的应用
  • 4.3 关于大批量EST数据的预处理问题
  • 4.4 关于大规模EST数据的聚类拼接问题
  • 4.5 关于全长cDNA序列的批量注释与功能分类
  • 4.6 关于从大批量全长cDNA文库中挖掘差异表达基因
  • 4.7 关于物种GC含量与最优密码子使用特性的分析
  • 4.8 关于作为多倍体典型的小麦中基因表达情况
  • 全文结论
  • 参考文献
  • 致谢
  • 作者简介
  • 相关论文文献

    • [1].斑点叉尾苗种全长与体重的关系[J]. 水产养殖 2010(05)
    • [2].柑橘脉突病毒基因组全长cDNA克隆及其侵染性鉴定[J]. 中国农业科学 2020(18)
    • [3].全长粘结抗浮锚杆施工技术[J]. 中小企业管理与科技(上旬刊) 2012(08)
    • [4].海南番木瓜花叶病毒全长cDNA克隆及序列分析[J]. 热带作物学报 2013(02)
    • [5].拟南芥全长cDNA研究进展[J]. 科技致富向导 2012(36)
    • [6].下肢全长拼接摄影在下肢截骨术中的应用价值[J]. 放射学实践 2014(06)
    • [7].下颌缘全长截骨治疗单侧下颌骨过度发育[J]. 中国美容医学 2009(08)
    • [8].树脂锚杆全长锚固技术研究及应用[J]. 煤矿支护 2014(03)
    • [9].采用哺乳动物细胞表面展示技术构建全长人源抗肾癌抗体基因库[J]. 南方医科大学学报 2010(05)
    • [10].汶马高速开工 全长174km 一半是隧道[J]. 隧道建设 2014(11)
    • [11].X线摄影刻度尺在下肢全长X线摄影中的应用[J]. 中国临床研究 2013(10)
    • [12].获取基因全长c DNA策略及应用[J]. 健康研究 2009(02)
    • [13].猪瘟病毒全长突变型cDNA克隆的构建及其在细胞水平的恢复[J]. 南昌大学学报(理科版) 2009(04)
    • [14].谈水利工程全长粘结型锚杆材料与设备的应用[J]. 民营科技 2012(09)
    • [15].泥蚶胰岛素生长因子1受体基因的cDNA全长克隆及表达分析[J]. 水产学报 2017(01)
    • [16].人工养殖大鲵全长与体重关系的回归分析[J]. 基因组学与应用生物学 2012(04)
    • [17].鸭坦布苏病毒基因组全长cDNA克隆构建与分析[J]. 浙江农业学报 2015(11)
    • [18].泥蚶谷胱甘肽过氧化物酶基因的全长克隆与表达分析[J]. 水生生物学报 2016(06)
    • [19].家蚕质型多角体病毒感染应答的假定蛋白基因全长cDNA克隆与表达特征分析[J]. 蚕业科学 2010(06)
    • [20].建鲤葡萄糖激酶基因全长cDNA的克隆及组织表达[J]. 食品科学 2009(17)
    • [21].一种全长cDNA抑制缩减杂交方法及其水稻诱导表达基因分离的应用[J]. 华南农业大学学报 2010(01)
    • [22].玉米基因组全长cDNA序列获得的辅助策略及其效用评价[J]. 华北农学报 2008(S1)
    • [23].山东栒子全长转录组测序数据组装及功能注释[J]. 分子植物育种 2020(01)
    • [24].戒全长老圆寂三周年纪念法会举行[J]. 法音 2015(04)
    • [25].负重位下肢全长的摄影体会[J]. 临床军医杂志 2013(01)
    • [26].煤矿锚杆全长锚固支护的研究与实践[J]. 河北化工 2013(02)
    • [27].日本血吸虫视黄酸X受体2全长cDNA的克隆及初步分析[J]. 中国血吸虫病防治杂志 2012(04)
    • [28].Pllilips DR下肢全长立位摄影技术临床运用体会[J]. 新疆医学 2012(07)
    • [29].结缔组织生长因子全长及其缺失突变体重组腺病毒的构建和鉴定[J]. 重庆医科大学学报 2011(08)
    • [30].甘肃:敦煌首条高速公路全面完工 全长146公里[J]. 西部交通科技 2014(11)

    标签:;  ;  ;  ;  ;  ;  

    小麦全长cDNA文库构建、测序与分析
    下载Doc文档

    猜你喜欢