SNP芯片数据库及其分析工具的构建和应用

SNP芯片数据库及其分析工具的构建和应用

论文题目: SNP芯片数据库及其分析工具的构建和应用

论文类型: 硕士论文

论文专业: 生物医学工程

作者: 董献军

导师: 陆祖宏

关键词: 生物信息学,单碱基多态性,病例对照分析,卡方检验,哈迪温伯格平衡,回归模型,冠心病,氧化低密度脂蛋白受体

文献来源: 东南大学

发表年度: 2005

论文摘要: 随着人类基因组计划的完成,生命科学进入了后基因组时代。科学家开始探究疾病与基因的关系,并把目光投向基因组上特殊的遗传标记位点——SNP。SNP多态性位点的差异有可能造成人们罹患疾病的不同风险和对药物的不同反应。发现这些与常见疾病相关的DNA序列上的多态位点,是了解引起人类疾病的复杂原因和人类族群迁徙的最重要途径之一。本实验室就是在这样的背景下启动DrSNP(Disease-related SNP)项目的。目前在疾病与基因多态性关系的研究中,人们针对某个疾病或某个SNP位点的研究还呈现单一性,而且各个机构之间的原始数据得不到很好的互享,不同研究群体之间的分析单独进行。然而,实际影响某个疾病的因素可能是多样的,多基因位点、多种环境因素共同作用的结果,简单的小样本数据和单一的分析方法是不可胜任的。特别是对于那些复杂遗传疾病,需要收集大量的样本,采用数据挖掘的方法,建立专门的数据库和分析工具。基于以上设想,我们的研究思路是:建立SNP芯片数据库和样本数据库,并且在此基础上开发、集成各种分析方法,让用户可以共享数据,同时可以实现在线(on web)的数据分析。在本论文中,我们设计了SNP相关的数据库系统,提出了SNP数据的分析框架,并且完成了用户在线调用R中的工具包实现统计分析的方案。下面是论文的主要内容:(1)构建SNP相关的数据库以及分析框架DrSNP(Disease-related SNP)项目旨在通过整合三方面的数据(病人样本数据、SNP芯片实验数据、SNP信息数据),通过SNP位点筛选以及实验结果统计分析的生物信息学方法,应用生物芯片技术,最终探索疾病和基因多态性之间的关系。本论文完成了SNP相关数据库的设计,以及构建各个数据库的关联。并且在此基础上,提出了基于这三个数据库的SNP数据分析框架,以及相应的数学分析模型。(2)开发了基于Web的R分析环境和R程序包R是一个开源的用于统计计算和图形化显示的语言环境。鉴于这一特点,我们在论文中选用它作为系统底层的分析计算环境,并且用Rserve+JSP的模式实现了客户在Web端调用后台R程序进行统计计算的诉求。根据SNP芯片数据的特点,我们开发了一系列用于SNP分析的R程序包,例如Hardy-Weinberg平衡检验,基因型频率分布,疾病相关指标的显著性分析,疾病危险因素的回归分析。(3)冠心病人与OLR1基因多态性的相关性研究论文最后通过分析氧化低密度脂蛋白受体1(OLR1)基因上两个位点的基因型数据,讨论了冠心病和基因多态性的相关性。论文收集了来自三个医院的338例冠心病病人(HX:272例,SD:50例,GL:16例)和280例频数配对的正常人的基因型数据,用R编写的工具包对这些数据进行HWE检验,冠心病的各项指标对照分析,组间基因型频率和基因频率的对照分析以及位点间的Haplotype分析等等。结果显示TC、HDL、LDL、LDL/HDL以及TC/HDL这些指标在病人组和正常组之间呈现显著性差异,位点基因型分析显示基因型频率在疾病组和正常组之间没有呈现很强的差异性,单体型频率在疾病组对照组之间也没有显著性差异。

论文目录:

中文摘要

Abstract

缩写及术语表

第一章 绪论

1.1 研究背景

1.2 SNP 与疾病

1.3 论文的研究内容

参考文献

第二章 疾病相关的SNP 数据库平台

2.1 DrSNP 介绍

2.2 DrSNP 系统数据管理

2.3 SNP 筛选

2.4 芯片结果分析

2.5 小结

参考文献

第三章 基于R 的Web 分析环境

3.1 引言

3.2 DrSNP 系统分析部分的用户需求

3.3 可选解决方案

3.4 选择R 的理由

3.5 具体解决方案

3.6 分析环境的应用

3.7 小结

参考文献

第四章 冠心病与氧化LDL 受体1 基因多态性的关系

4.1 背景

4.2 材料和方法

4.3 分析结果

4.4 讨论

参考文献

第五章 总结和展望

5.1 论文工作的主要内容和成果

5.2 工作展望

致谢

附录

硕士阶段发表论文清单

发布时间: 2007-06-11

参考文献

  • [1].中国人逐拍标注心电图数据库的构建[D]. 陈鑫.北京协和医学院2012
  • [2].基于基因芯片方法的孤独症和SNP相关性分析[D]. 杨耀.东南大学2006
  • [3].肿瘤遗传信息数据库的开发和利用[D]. 郭华.吉林大学2006
  • [4].基于聚丙烯酰胺凝胶的高通量SNP检测芯片的研究及应用[D]. 孙蓓丽.东南大学2006
  • [5].SNP对于转录因子结合及基因表达的影响[D]. 董立丽.哈尔滨工业大学2015
  • [6].基于多位点连锁不平衡度量的标签SNP选择方法研究[D]. 贺永恒.中南大学2014
  • [7].基于二代测序的目标区段SNP识别数据流的建立与比较分析[D]. 夏昊.东华大学2016
  • [8].全基因组关联分析中SNP数据补缺算法研究与实现[D]. 张轶夫.哈尔滨工业大学2015
  • [9].光诱导SNP的NO释放及其生物学应用研究[D]. 张晨阳.山西大学2015
  • [10].Caché数据库在住院管理系统中的应用研究[D]. 王玮.浙江大学2008

相关论文

  • [1].蛋白质结构数据库的信息挖掘[D]. 黄涛.同济大学2006
  • [2].基于聚丙烯酰胺凝胶的高通量SNP检测芯片的研究及应用[D]. 孙蓓丽.东南大学2006
  • [3].基于基因芯片方法的孤独症和SNP相关性分析[D]. 杨耀.东南大学2006
  • [4].小麦抗旱相关基因TaDREB1的SNP标记开发与定位[D]. 卫波.西北农林科技大学2006
  • [5].基于DrSNP的SNP筛选策略的探索和实现[D]. 王琦.东南大学2005
  • [6].新型SNP检测芯片的制备及其在恶性血液病相对风险度检测中的应用[D]. 姜妮.东南大学2005
  • [7].本地SNP数据库的构建和两序列相似性比对算法的改进[D]. 向天雨.重庆医科大学2005
  • [8].正相杂交型SNP检测芯片用于近交系小鼠遗传监测[D]. 瞿秀华.第二军医大学2006
  • [9].生物信息学数据库的设计与实现[D]. 刘月兰.黑龙江大学2005
  • [10].基于SNP遗传谱的复杂疾病基因作图与网络构建方法研究[D]. 张帆.哈尔滨工业大学2006

标签:;  ;  ;  ;  ;  ;  ;  ;  

SNP芯片数据库及其分析工具的构建和应用
下载Doc文档

猜你喜欢