微阵列基因表达论文-郭国俊

微阵列基因表达论文-郭国俊

导读:本文包含了微阵列基因表达论文开题报告文献综述及选题提纲参考文献,主要关键词:糖尿病周围神经病变,微阵列芯片,miRNA,lncRNA

微阵列基因表达论文文献综述

郭国俊[1](2019)在《基于微阵列芯片筛选糖尿病周围神经病变差异表达基因及其功能分析》一文中研究指出研究背景:周围神经病变是常见的糖尿病并发症,其确切的发病机制仍不清楚。lncRNA和miRNA广泛参与了各种生物学过程,对疾病的发生发展起了关键的作用,然而在糖尿病周围神经病变中却尚未被系统研究。本研究分为两部分,结合mRNA,分别研究miRNA和lncRNA在糖尿病周围神经病变中的作用。第一部分糖尿病周围神经病变miRNA-mRNA调节机制分析目的:全面揭示糖尿病周围神经病变大鼠背根神经节中差异表达的miRNA及其靶基因mRNA在神经病变中的调节作用。方法:使用20只8周龄、体重在180-220g的健康雄性SD大鼠,随机分成两组(糖尿病组和对照组)。禁食不禁水12小时后,糖尿病组腹腔注射链脲佐菌素(65mg/kg),对照组腹腔注射等体积的柠檬酸盐缓冲液。7天后取尾静脉血检测非空腹血糖,血糖大于16.7mM表示糖尿病诱导成功。继续饲养8周后评估周围神经是否发生病变,我们采用电子测痛仪(Electronic Von Frey)测量缩足反应阈值以及坐骨神经横截面透射电镜两种方法进行评估。随后对大鼠处以安乐死,收集双侧L3-L6背根神经节,提取总RNA。采用微阵列芯片筛选出差异表达的miRNA和mRNA(Affymetrix GeneChip miRNA 4.0 Array和Affymetrix GeneChip Rat Transcriptome Array 1.0)。利用miRanda数据库,对miRNA靶基因进行预测,然后与筛选出的差异mRNA取交集,并进一步筛选出与相应miRNA呈负相关的mRNA。对所得出的mRNA进行GO和pathway分析,鉴别出富集的基因功能和信号通路,同时结合差异miRNA构建miRNA-mRNA调控网络,进一步鉴别出网络中的关键调控基因。最后,我们对关键的miRNA进行PCR验证。结果:非空腹血糖检测提示1只实验组大鼠血糖不符合标准,因此排除。与对照组相比,糖尿病组的缩足反应阈值显着降低,透射电镜提示坐骨神经明显的髓鞘分离和脱髓鞘。通过微阵列芯片检测,我们发现了37个miRNA和1357个mRNA在糖尿病周围神经病变大鼠背根神经节中差异表达。对筛选出的mRNA做GO和pathway分析,共得出399个显着富集的GO terms(257个为下调、142个为上调)和29个显着富集的pathway(23个为下调、6个为上调)。对miRNA-mRNA调控网络进行分析,我们得出rno-miR-330-5p,rno-miR-17-1-3p和rno-miR-346可能是网络的核心,而mRNA中Podxl和Hoxa1拥有最高的连接度。PCR的验证结果与基因芯片结果相一致。结论:本研究成功诱导了糖尿病周围神经病变大鼠,并筛选出了糖尿病周围神经病变大鼠背根神经节中异常表达的miRNA和mRNA。通过GO分析、pathway分析和miRNA-mRNA调控网络分析,我们发现这些差异表达基因可能对糖尿病周围神经病变起了重要的作用。第二部分糖尿病周围神经病变lncRNA-mRNA表达谱分析及ceRNA网络构建目的:综合分析lncRNA和mRNA的生物信息学功能,以及在糖尿病周围神经病变中的作用,同时构建lncRNA-miRNA-mRNA ceRNA网络。方法:糖尿病造模、组织取材同第一部分。采用微阵列芯片Affymetrix GeneChip Rat Transcriptome Array 1.0筛选异常表达的lncRNA和mRNA。对差异表达的mRNA进行GO和pathway分析,鉴别出富集的基因功能和信号通路。将GO和pathway分析结果的交叉基因进行signal-net分析,鉴别出可能的关键基因。建立lncRNA-mRNA共表达网络,确定lncRNA与mRNA的相互作用模型,进而分析lncRNA在糖尿病周围神经病变中可能的调节作用。根据竞争性内源性RNA(ceRNA)假说,结合所获得的差异miRNA、lncRNA和mRNA数据,我们进一步建立ceR NA网络,探讨ceR NA网络在糖尿病周围神经病变中的作用。最后,我们对其中的关键基因进行了PCR和Western blot验证。结果:我们共发现了983个lncRNA和1357个mRNA异常表达。对这1357的差异表达mRNA做GO和pathway分析,共得出558个显着富集的GO term(s368个为下调、190个为上调)和94个显着富集的pathway(57个为下调、37个为上调)。signal-net分析提示Plcd和Itgb3拥有最高的中介中心性(betweenness centrality),而整合素受体(Itgb3、Itgb1、Itgb8和Itga6)拥有最高的连接度,提示这些mRNA的重要性。我们建立的lncRNA-mRNA共表达网络中,共包含474个lncRNA和169个mRNA。网络中包含1426个lncRNA-mRNA连接,其中569个为负相关,857个为正相关,lncRNA speegaw.aSep08-unspliced具有最高的连接度,而mRNA中Scd1、Map4k4和Tyrp1具有最高的连接度。ceR NA网络分析提示,差异基因与鞘脂类代谢等生物过程,以及IL-17信号通路、PPAR信号通路以及Wnt信号通路相关。PCR和Western blot验证结果提示基因芯片结果具有高度的可靠性。结论:本研究提示差异表达的lncRNA通过调节共表达的mRNA,对糖尿病周围神经病变的病理过程起了重要调节作用。与此同时,ceR NA网络也参与糖尿病周围神经病变多种病理生理过程,提示其在疾病中的重要性。(本文来源于《华中科技大学》期刊2019-05-01)

李自法[2](2018)在《面向基因表达微阵列数据的高效特征选择和分类方法研究》一文中研究指出基因芯片技术诞生以来,催生出了大量的基因表达微阵列数据,其中隐藏着非常有价值的生物学信息。分析这些数据,挖掘其中潜藏的生物学信息,为复杂疾病的诊断和治疗带来了新的可能性。样本个数少、维度高和类别不平衡是基因表达微阵列数据的主要特点,也是对现有数据挖掘技术构成的最大挑战。基于现有方法,本文致力于更高效的特征选择算法研究,同时尝试解决类别不平衡问题以及寻找更适合基因表达微阵列数据的分类算法。使用6个本领域最频繁被使用的数据集作为实验数据,使用分类准确率、马修相关系数和ROC曲线底部面积作为评价标准,结合分层的5折交叉验证策略对本文提出的方法进行实验验证。主要工作和结论如下:(1)提出了一种称为RVOS的数据采样方法来尝试解决基因表达微阵列数据的类别不平衡问题。实验结果表明,经过平衡后的数据集获得了相当或者更好的分类结果。由于平衡后的数据集各类样本分布更加均衡,因此分类结果更加可信。(2)改进递归特征消除方法,提出了一种称为VSSRFE的步长可变的递归特征消除策略。本文用SVM-VSSRFE和SVM-RFE分别作为特征选择器做特征选择。实验结果显示,SVM-VSSRFE的时间消耗获得了数百倍的减少;在3个数据上获得了更好的分类效果,同时在另外3个数据集上分类效果有一定程度的下降。(3)引入一种被称为LLSVM的大尺度线性支持向量机,更高效地实现特征选择。这是经典支持向量机的一种更高效的实现,专门用来处理类似于基因表达微阵列数据的高维线性分类问题。实验结果表明,在保证特征选择质量的前提下,LLSVM在5个数据集上所耗费的时间都远远少于经典的支持向量机,在部分数据集上甚至有超过10倍的缩减。(4)深入研究了不同分类方法对分类结果的影响。在6个数据集上的实验结果证明,支持向量机并不总是最好的选择,L2正则化的逻辑回归可以获得相当或更好的结果。(本文来源于《华侨大学》期刊2018-05-31)

董文娟[3](2017)在《微阵列基因表达数据混合特征算法研究》一文中研究指出DNA微阵列技术是由生物学,融微电子学、计算机科学和广电化学为一体,在原来核酸杂交的基础上发展起来的一项新技术,在医学和生物学的研究中得到了高度重视。近几年来,随着大规模高通量微阵列技术的快速发展,在一次实验中获得成千上万个基因的表达水平成为现实。这种高新的技术为基因表达数据的搜集提供了便利,从一次实验获得大量的反应基因产物mRNA丰度的数据,通过微阵列技术得到的反应mRNA丰度的数据通常称为微阵列基因表达数据,简称微阵列。自上个世纪90年代以来微阵列技术逐步形成,对生物领域产生深远影响,它的出现使基因活性的检测成为可能,将微阵列技术应用病理诊断分析的实验便由此开始。此后,在经历了20多年的不断发展,将生物医学,计算机等领域将其融合。如今,微阵列技术不断完善,成为生物信息学中热门话题,为人类探索生物信息提供了新的篇章。由于微阵列的维数高,噪声大,及冗余性强等特性,这种特征给基因选择的实验带来了挑战;本文提出一种面向高维微阵列数据的混合特征算法,根据信噪比方法,Lasso方法,Filter方法及Wrapper方法混合优势对微阵列基因表达数据分析,提出混合Relief-PSO方法对数据分析研究。本文首先回顾微阵列数据分析的一些方法,然后介绍集成系统学习的方法。最后是关于新的集成技术在微阵列数据上的应用。主要工作如下:(1)微阵列算法的介绍,以及对于单独的信噪比方法,Lasso方法,Filter方法,Wrapper方法的特征在微阵列的应用。借于结合的信噪比和Lasso法、Filter法和Wrapper法混合。最后阐明本文的主要研究内容。(2)单个实验产生的微阵列数据难免会达不到理想状态,也会影响到数据学习训练分类器的效果和泛化能力,将多个实验的方法集成起来可以提高分类器泛化能力和实验数据的高效性,也更加接近基因表达数据的分析能力,在处理高维小样本、高冗余、高噪声的基因微阵列数据时,无法采用传统特征选择方法进行分析。本文针对该问题提出了一种结合Relief算法和粒子群优化算法(Relief-PSO)的混合特征选择方法,检测这种算法对数据的分类效果,产生泛化能力更好的集成算法。(本文来源于《沈阳工业大学》期刊2017-05-21)

刘柱[4](2017)在《应用微阵列分析瘦素对骨关节炎软骨细胞基因表达的相关性研究》一文中研究指出背景:微阵列分析已经广泛应用于基因检测。应用微阵列分析技术分析瘦素所诱导的骨关节炎(Osteoarthritis,OA)大鼠软骨细胞的基因表达谱,探讨瘦素对大鼠关节软骨基因表达谱的影响,从基因表达层面探讨瘦素在调节OA软骨细胞凋亡中发挥的作用,为瘦素调节OA软骨细胞凋亡提供新的理论基础。方法:将实验大鼠分为叁组,瘦素诱导组、空白对照组、OA组,应用微阵列分析技术分析软骨细胞RNA表达谱,并通过定量逆转录聚合酶链反应(RT-q PCR)进行验证。应用基因本体(Gene Ontology,GO)分析、信号通路(Pathway)分析对差异基因的功能进行评价。结果:瘦素可以诱导关节软骨的破坏和降解,诱导OA的发生。通过分析瘦素诱导组、空白对照组软骨细胞RNA杂交结果,两组间共有1857个基因存在显着差异,其中1197个基因上调,660个基因下调。经过微阵列的分析结果发现,瘦素可以诱导一些OA相关基因的表达,包括炎症因子(如白介素1β,IL-1β)、基质金属蛋白酶(MMPs;MMP-3,MMP13)、胰岛素样生长因子结合蛋白6(IFGBP6)的表达明显上调,参与OA的进展,此外我们还发现了新的候选基因如BCL2L11(BIM)表达的明显上调,可能参与OA的进展。结论:瘦素在OA的进展中发挥着重要的功能,可以通过调节多个OA相关基因的表达来介导OA的发生。瘦素诱导新的候选基因BCL2L11的表达为阐明OA发病的分子机制和潜在治疗靶点提供了新的理论基础。(本文来源于《上海交通大学》期刊2017-04-18)

史舟芳[5](2016)在《基于微阵列芯片技术的胃癌circRNA及基因表达谱研究》一文中研究指出胃癌(gastric cancer)是一种发生于胃粘膜上皮的恶性肿瘤。由于胃癌具有发病率高、侵袭转移特征、明显的临床症状以及低治愈率等特征,使其成为临床面临的主要疾病之一。造成胃癌死亡率居高不下的主要原因是其早期症状多缺乏特异性,对其检测和预防具有很大困难。近年来,尽管不断有和胃癌相关的癌基因、抑癌基因以及肿瘤信号通路等被发现和证实,但其发病机制尚未完全清楚。因此,寻找新的生物学靶标用于胃癌的癌变监测和干预成为胃癌防治迫切需要解决的问题。环状RNA(circular RNA,circRNA)是一类多样且广泛存在于哺乳动物细胞中,具有调控基因表达作用的内源性RNA分子。CircRNA利用其microRNA(miRNA)应答元件结合miRNA,以阻断miRNA对其靶标表达的抑制作用,从而调控其他相关RNA的表达水平。CircRNA在动脉粥样硬化、神经系统紊乱、糖尿病和肿瘤等疾病发生过程中起着较为重要的作用。深入研究circRNA的表达特点及其功能,可能使我们更好地了解疾病的发生机制,提高相关疾病的预防和诊断水平。CircRNA的发现为癌症早期诊断的研究开辟了崭新的研究领域。目的:通过获得的表达谱筛选胃癌组织和癌旁组织差异性表达的mRNA和circRNA,并对差异性表达的circRNA和mRNA进行关联分析,探讨circRNA在胃癌中的表达情况及其作用机制。方法:选取8例手术切除新鲜冻存的胃癌组织及其对应的正常癌旁组织,利用Trizol法提取总RNA,使用NanoDrop ND-1000检测RNA是否降解并测定RNA浓度;采用Agilent表达谱芯片分析胃癌组织及癌旁组织circRNA、mRNA差异表达谱。应用RT-PCR验证差异表达的circRNA和mRNA在胃癌组织和癌旁组织中的表达情况;根据circRNA与miRNA以及miRNA与mRNA可能存在的相互作用,分析胃癌组织及癌旁组织显着差异circRNA与mRNA可能存在的关联关系。结果:(1)circRNA表达谱芯片分析发现差异表达显着的circRNA 1285个,其中下调表达circRNA 594个,上调表达circRNA 691个。RT-PCR验证实验表明hsa_circRNA_400071、hsa_circRNA_000543、hsa_circRNA_001959 等的表达情况与芯片分析结果一致。(2)mRNA表达谱芯片在胃癌组织及其癌旁组织中共检测到基因29112个,其中差异表达基因共5460个,上调表达基因2390个,下调表达基因3070个。对差异基因进行GO分析,发现参与生物过程的基因有1638个,参与细胞组成的基因有205个,参与分子功能的基因有147个;对差异基因进行Pathway通路分析,发现显着富集基因通路83条,其中包括上调基因28个,下调基因55个。RT-PCR实验表明,差异基因MYH9、CD44、ARVCF等的表达情况与芯片分析结果一致。(3)通过对circRNA与mRNA表达谱的关联关系分析,发现69个差异表达circRNA可能通过吸附特定的miRNA,调控其靶基因mRNA的表达。结论:(1)差异表达circRNA有其对应的miRNA结合位点,通过与miRNA的相互作用,调控靶基因的表达。这些circRNA在未来有可能成为新的胃癌分子生物学标志物。(2)差异表达基因可能通过多种途径、角色参与胃癌肿瘤的发生。(3)CD44、CXXC5、MYH9、MALAT1 等基因通过 circRNA 与 miRNA、miRNA与mRNA的相互作用,以不同的方式调控,相互作用,相互影响,有可能对胃癌的发生、发展有重要影响。(本文来源于《广西师范大学》期刊2016-04-01)

刘曦,刘卓琦,罗达亚[6](2016)在《基因表达谱微阵列网络数据库在肿瘤研究中的应用》一文中研究指出基因表达谱微阵列数据库是一类可提供存储、查询、下载分析的在线网络数据库,在肿瘤相关领域的研究中提供了大量的数据来源。由于微阵列分析对于无生物/医学信息学专业背景的研究人员仍然有较多困难,致使该数据库的使用尚未普及。本文从数据查询、下载分析和使用方法等方面对常用基因表达谱微阵列数据库进行概述,并对现阶段基因表达微阵列数据库的应用策略进行总结,旨在帮助该领域研究的初学工作者了解数据库的基本知识并推动其在科研工作中的应用。(本文来源于《中国生物化学与分子生物学报》期刊2016年03期)

王志玲[7](2016)在《基于基因表达微阵列数据集的加权双向聚类算法研究》一文中研究指出随着生物信息技术的迅速发展,基因芯片技术在生物界领域有了明显的进展,它不仅反映了当前细胞生理状态以及基因之间的相关性,而且对于癌症亚型的识别、药物靶点的检测、药物疗效的诊断以及揭示疾病发生机制等领域起到至关重要的作用,因此基于基因表达微阵列数据的一些相关研究是生物技术领域的核心.基于基因表达微阵列数据的分析方法一般是利用聚类方法来挖掘矩阵中所隐藏的重要信息.由于基因表达数据具有双向关联的特性,所以传统的聚类算法在基因表达数据的研究中就受到了一定的局限,传统的聚类算法只能单一对行或列进行聚类从而找出基因表达矩阵的全局信息,而最终却忽略了其中重要的局部信息,因此一般的聚类算法没有办法精确地映射出基因与条件之间的紧密关系.本文主要针对一般聚类方法的不足,提出了基于基因表达数据无监督的加权双向聚类算法,具体做了以下几项工作:首先,利用最小生成森林法生成了基因调控网络.而根据基因调控网络中基因的重要性给每一个基因分配相应的权重.其次,在基因生成网络的基础上提出了加权的双向聚类算法.最后,针对于已有的验证指标,即平均残差(ASR指标)进行了改进,然后将改进的指标与已提出的指标进行比较,最终确定了最优的聚类个数.并且我们将该方法应用到乳腺癌和青少年类风湿性关节炎两组数据上,实例表明本论文所提出的加权双向聚类算法具有很好的聚类效果.(本文来源于《黑龙江大学》期刊2016-03-10)

王爱国[8](2015)在《微阵列基因表达数据的特征分析方法研究》一文中研究指出微阵列技术的快速发展使得同时测量成千上万个基因的表达情况成为可能,并被广泛地用于研究不同癌症和肿瘤的基因表达模式,为从分子水平研究疾病机理以及疾病诊断和预后提供了一种强有力的手段。由于微阵列技术的特点和现有技术水平的局限性,获得的微阵列数据体现出“高维度,小样本,高噪声”的特点,这些数据往往包含大量的无关基因和冗余基因,对微阵列基因表达数据分析提出了严峻的挑战。如何从中选出具有判别能力的信息基因,研究基因与癌症之间的关系,对于深入发现和理解疾病机理以及提高疾病的临床诊断准确率具有重要作用。在微阵列技术中,经常将基因作为特征来表示。本文以微阵列数据为应用靶点,重点在基因选择方法上开展深入的研究工作,取得的主要研究成果包括以下几个方面:(1)基于封装的特征选择方法使用分类器作为评价候选特征质量的效用函数,因此具有较大的时间花费。在使用K近邻分类器时,指出大量重复地计算样本间的距离是造成较高时间复杂度的一个重要原因,然后提出构建逻辑存储结构分类距离矩阵用于显式地存储、计算和更新样本间的特征距离,以改善特征选择的时间性能。实验结果表明,所提出的方法不仅能够获得高质量的特征子集,而且能够极大地降低特征选择的时间成本。最后,通过时间和空间复杂度分析说明所提出算法的高效性和可行性。(2)针对基于封装的特征选择方法在特征选择过程中需要执行大量的封装评价以及花费较大时间代价的问题,指出造成该问题的一个重要原因是封装方法在执行过程不能显式地识别冗余特征并将其从候选特征集合中删除。在此基础上,提出将马尔科夫毯技术嵌入到基于封装的特征选择过程中用于冗余特征的识别和删除,以减少需要执行的封装评价次数。最后,通过理论分析和实验验证所提出算法的有效性和效率。实验结果表明,所提出的方法能够保证获得的高质量的特征子集,同时能够显着地减少需要执行的封装评价次数,提高时间性能。(3)针对基于偏最小二乘法的递归特征消去方法在高维数据上进行特征选择具有较高时间复杂度的问题,指出在每次迭代过程中只从候选特征集中删除一个最不重要的特征是造成该问题的主要原因。为改善该问题,受冶金退火中温度衰减过程的启发,提出两种基于动态特征消去策略的特征选择算法PLS-RFE-SA和PLS-RFE-SQRT。这两个算法的核心思想是在起始阶段从候选特征集中删除大量的不重要特征,并且随着迭代的进行,每次删除的特征个数逐渐减少,直至完成对所有的特征的排序。实验结果表明,PLS-RFE-SA和PLS-RFE-SQRT不仅能够获得高质量的特征子集,而且能够显着地改善算法的时间性能;关于特征子集一致性的实验结果表明,与PLS-RFE-SQRT相比,PLS-RFE-SA能够获得具有更好一致性的特征子集。最后,通过理论分析论述所提出的两个算法在时间性能上的优越性。(4)针对高维小样本数据容易导致“过拟合”的问题,提出一种混合的特征选择算法mRMR-HS,该算法能够综合利用基于过滤方法的低时间复杂度和基于封装方法的高分类准确率的优点。所提出的算法包括两个阶段:第一个阶段是无关特征的删除,使用最小冗余最大相关算法mRMR从原始特征空间中选出一部分与目标类别具有较大相关性的特征;第二个阶段是候选特征子集寻优,利用具有全局启发式搜索功能的和声搜索算法HS产生候选特征子集,通过封装的方式评价这些候选特征的质量,并返回能够获得最优适应值的特征子集。实验结果表明,与mRMR相比,mRMR-HS能够获得更好的分类准确率;与HS相比,mRMR-HS具有较快的收敛速率,能够获得更紧凑的特征子集。(本文来源于《合肥工业大学》期刊2015-10-01)

刘英男[9](2015)在《微阵列基因表达数据的选择及方法》一文中研究指出目前,基因芯片技术在基因组信息学研究中占据了领导地位。本文通过介绍DNA微阵列技术的数据分析意义,深入地阐述了分析基因表达数据目前面临的难题,并详细地介绍了现阶段的基因选择方法。(本文来源于《现代交际》期刊2015年08期)

尹丰,张剑宁,赵明明,周春辉,王淑为[10](2014)在《胶质瘤干细胞与神经干细胞基因表达差异的微阵列基因芯片分析》一文中研究指出目的利用基因芯片技术筛选人脑胶质瘤干细胞(GSCs)和正常神经干细胞(NSCs)中差异表达的基因。方法利用人类HOA5.1 OneArray表达谱芯片(包括29 186个基因),与GSCs和NSCs的总RNA生成的探针进行杂交,通过寡核苷酸芯片ScanArray 4000筛选两者之间的差异基因,并选择其中的部分差异表达基因(DCX、PTGS2、SCGN、GAD2、OTX2、PEG10、NRXN3)进一步行qRT-PCR验证。结果与正常NSCs相比,GSCs中1372个基因表达下调,1501个基因表达上调,功能富集分析显示,这些差异基因主要参与了神经轴突导向、细胞周期、细胞黏附、免疫炎症反应及癌症相关的信号路径。qRT-PCR检测结果与芯片检测结果相符。结论多类基因在胶质瘤的发生发展中发挥着重要作用,该结果可为胶质瘤的靶向治疗提供新的线索。(本文来源于《解放军医学杂志》期刊2014年10期)

微阵列基因表达论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基因芯片技术诞生以来,催生出了大量的基因表达微阵列数据,其中隐藏着非常有价值的生物学信息。分析这些数据,挖掘其中潜藏的生物学信息,为复杂疾病的诊断和治疗带来了新的可能性。样本个数少、维度高和类别不平衡是基因表达微阵列数据的主要特点,也是对现有数据挖掘技术构成的最大挑战。基于现有方法,本文致力于更高效的特征选择算法研究,同时尝试解决类别不平衡问题以及寻找更适合基因表达微阵列数据的分类算法。使用6个本领域最频繁被使用的数据集作为实验数据,使用分类准确率、马修相关系数和ROC曲线底部面积作为评价标准,结合分层的5折交叉验证策略对本文提出的方法进行实验验证。主要工作和结论如下:(1)提出了一种称为RVOS的数据采样方法来尝试解决基因表达微阵列数据的类别不平衡问题。实验结果表明,经过平衡后的数据集获得了相当或者更好的分类结果。由于平衡后的数据集各类样本分布更加均衡,因此分类结果更加可信。(2)改进递归特征消除方法,提出了一种称为VSSRFE的步长可变的递归特征消除策略。本文用SVM-VSSRFE和SVM-RFE分别作为特征选择器做特征选择。实验结果显示,SVM-VSSRFE的时间消耗获得了数百倍的减少;在3个数据上获得了更好的分类效果,同时在另外3个数据集上分类效果有一定程度的下降。(3)引入一种被称为LLSVM的大尺度线性支持向量机,更高效地实现特征选择。这是经典支持向量机的一种更高效的实现,专门用来处理类似于基因表达微阵列数据的高维线性分类问题。实验结果表明,在保证特征选择质量的前提下,LLSVM在5个数据集上所耗费的时间都远远少于经典的支持向量机,在部分数据集上甚至有超过10倍的缩减。(4)深入研究了不同分类方法对分类结果的影响。在6个数据集上的实验结果证明,支持向量机并不总是最好的选择,L2正则化的逻辑回归可以获得相当或更好的结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

微阵列基因表达论文参考文献

[1].郭国俊.基于微阵列芯片筛选糖尿病周围神经病变差异表达基因及其功能分析[D].华中科技大学.2019

[2].李自法.面向基因表达微阵列数据的高效特征选择和分类方法研究[D].华侨大学.2018

[3].董文娟.微阵列基因表达数据混合特征算法研究[D].沈阳工业大学.2017

[4].刘柱.应用微阵列分析瘦素对骨关节炎软骨细胞基因表达的相关性研究[D].上海交通大学.2017

[5].史舟芳.基于微阵列芯片技术的胃癌circRNA及基因表达谱研究[D].广西师范大学.2016

[6].刘曦,刘卓琦,罗达亚.基因表达谱微阵列网络数据库在肿瘤研究中的应用[J].中国生物化学与分子生物学报.2016

[7].王志玲.基于基因表达微阵列数据集的加权双向聚类算法研究[D].黑龙江大学.2016

[8].王爱国.微阵列基因表达数据的特征分析方法研究[D].合肥工业大学.2015

[9].刘英男.微阵列基因表达数据的选择及方法[J].现代交际.2015

[10].尹丰,张剑宁,赵明明,周春辉,王淑为.胶质瘤干细胞与神经干细胞基因表达差异的微阵列基因芯片分析[J].解放军医学杂志.2014

标签:;  ;  ;  ;  

微阵列基因表达论文-郭国俊
下载Doc文档

猜你喜欢