基于P2P的生物信息检索

基于P2P的生物信息检索

论文摘要

近年来,生物技术的发展,特别是人类基因组计划的开展和深入,大量生物文档出现,越来越多的生物序列(基因序列和蛋白质序列)被检测出来,而微阵列技术的发展也使得基因表达数据大量涌现。如何有效地利用这些资源就成了一个重要的课题。与此同时,对等计算(Peer-to-Peer,简称P2P)因其潜在的技术优势和广阔的应用前景,近年来引起工业界和学术界的广泛关注。本文首先实现了一个基于P2P的生物文档共享和检索系统。该系统通过灵活的节点加入策略、高效的索引机制、有效的路由策略,提供了基于元数据和内容等多种检索功能和友好的人机界面。应用部署证明系统具有很高的检索效率和跨平台数据交换能力。其次,为解决网络版和单机版BLAST存在的数据更新、序列隐私及数据源交互等问题,首次将P2P技术引入到序列比对中去,实现了基于P2P的生物序列搜索系统P2P-BLAST。P2P-BLAST实现了改进的BLAST算法,支持对DNA序列和蛋白质序列的个性化查询。与网络版的BLAST不同,P2P-BLAST没有中心数据库,共享的序列数据仍保存在本地,节点提交的包含特定序列的查询请求会被转发到有共享数据的节点,并在那些节点本地执行。P2P-BLAST对从不同节点得到的结果根据序列的相似度进行整合排序,并根据访问设置提供给节点浏览和下载。此外,本文提出了一种新的基于基因本体(Gene Ontology)的基因表达数据相似度算法——基因本体上的加权编辑距离算法,以用于基于基因表达数据相似度的检索等应用。此算法将微阵列基因表达数据映射到基因本体上的不同结构,通过定义在基因本体上的编辑操作以及不同结点的权重信息,计算不同结构之间的编辑距离,最后得到两个基因表达数据的相似度。

论文目录

  • 摘要
  • Abstract
  • 第一章 引言
  • 1.1 研究背景
  • 1.1.1 P2P技术
  • 1.1.2 生物序列比对
  • 1.1.3 基因表达数据相似性计算
  • 1.2 本文研究内容及成果
  • 1.2.1 基于P2P的生物文档共享与检索
  • 1.2.2 P2P-BLAST:基于P2P的生物序列搜索
  • 1.2.3 基于相似度的基因表达数据检索
  • 1.3 本文结构
  • 第二章 相关工作
  • 2.1 已有P2P系统
  • 2.1.1 早期的P2P系统
  • 2.1.2 部分集中的非结构化P2P系统
  • 2.1.3 结构化P2P系统
  • 2.1.4 其他系统
  • 2.2 生物序列比对方法
  • 2.2.1 序列两两比对算法
  • 2.2.2 多序列比对算法
  • 2.3 基因表达数据相似度计算算法
  • 2.3.1 Pearson相关系数(Pearson correlation coefficient)
  • 2.3.2 基于基因本体的基因表达数据相似度计算
  • 第三章 基于P2P的生物文档共享与检索
  • 3.1 系统结构
  • 3.1.1 网络拓扑
  • 3.1.2 节点结构
  • 3.1.3 工作流程
  • 3.2 关键技术
  • 3.2.1 超级节点的实现
  • 3.2.2 通信机制
  • 3.2.3 节点加入和退出策略
  • 3.2.4 索引机制
  • 3.2.5 路由策略
  • 3.3 系统介绍
  • 3.4 小结
  • 第四章 P2P-BLAST:基于P2P的生物序列搜索
  • 4.1 体系结构
  • 4.1.1 拓扑结构
  • 4.1.2 节点功能
  • 4.1.3 系统介绍
  • 4.2 系统实现
  • 4.2.1 算法选择
  • 4.2.2 打分矩阵
  • 4.2.3 序列搜索与共享
  • 4.2.4 结果排序
  • 4.3 小结
  • 第五章 基于相似度的基因表达数据检索
  • 5.1 基因本体上的编辑距离(GOED)
  • 5.2 权重函数
  • 5.2.1 不同层上结点的权重定义
  • 5.2.2 结点间关系的权重
  • 5.3 带权重信息的基因表达数据相似度计算
  • 5.3.1 基因本体上的加权编辑距离的计算
  • 5.3.2 基因表达数据相似度的计算
  • 5.4 小结
  • 第六章 总结与展望
  • 参考文献
  • 致谢
  • 相关论文文献

    • [1].P2P系统中安全激励机制的研究[J]. 科技信息 2010(22)
    • [2].网络计算的应用及发展前景[J]. 商场现代化 2010(16)
    • [3].一种新的P2P安全积分机制[J]. 计算机技术与发展 2009(08)
    • [4].一种新的应用层对等路由机制的研究[J]. 微电子学与计算机 2008(09)
    • [5].基于Web的数码照片共享和检索系统探讨[J]. 光盘技术 2009(03)
    • [6].基于Cloud-P2P网络平台的泛知识云模型[J]. 计算机应用研究 2014(02)
    • [7].一种基于JXTA的SOAP消息通信实现模型[J]. 计算机技术与发展 2009(08)
    • [8].BT和eMule的流量监控分析[J]. 信息通信 2013(08)
    • [9].基于P2P的RSS内容分发系统研究与实现[J]. 杭州电子科技大学学报 2008(02)
    • [10].基于Cayley图的P2P覆盖网络研究与分析[J]. 应用科技 2009(05)
    • [11].P2P流媒体系统概述[J]. 河池学院学报 2008(02)
    • [12].栅格环境下覆盖网络架构的研究[J]. 中国新通信 2014(10)
    • [13].P2P数据缓存机制研究[J]. 计算机工程与设计 2011(08)
    • [14].基于P2P的无线Mesh网中SIP服务器协作方案[J]. 微电子学与计算机 2011(12)
    • [15].P2P技术应用初探[J]. 中国科技信息 2008(07)
    • [16].浅析P2P技术[J]. 科技风 2008(04)
    • [17].科技热词[J]. 科学家 2017(23)
    • [18].数字娱乐的未来[J]. 中国图书评论 2009(01)
    • [19].基于访问控制列表下的校园网BT流量控制[J]. 福建电脑 2009(02)
    • [20].基于DHT的P2P系统中高可用数据冗余机制[J]. 计算机学报 2008(10)
    • [21].上海市计算机学会第九届学术年会征文通知[J]. 计算机应用与软件 2012(07)
    • [22].对等计算分析[J]. 重庆科技学院学报(自然科学版) 2010(01)
    • [23].推拉结合的P2P直播系统研究与实现[J]. 计算机工程 2008(08)
    • [24].支持语义的对等计算信息检索技术[J]. 应用科技 2009(03)
    • [25].P2P技术及其演进[J]. 现代传输 2008(03)
    • [26].一种新型的P2P信息检索系统体系结构[J]. 微计算机信息 2008(21)
    • [27].基于电子票券和全局信誉度的P2P激励机制[J]. 北京理工大学学报 2011(10)
    • [28].一种基于全局复合评价算法的Super Peer选择机制[J]. 东南大学学报(自然科学版) 2009(01)
    • [29].一种支持多维数据范围查询的对等计算索引框架[J]. 计算机研究与发展 2009(04)
    • [30].协同地球科学计算环境的架构设计[J]. 计算机工程与应用 2010(19)

    标签:;  ;  ;  ;  

    基于P2P的生物信息检索
    下载Doc文档

    猜你喜欢