论文摘要
随着互联网技术的迅猛发展,网络中的信息也随之快速地递增。在带给人们更多信息的同时,也大大的增加了互联网企业的运营和管理成本。为了解决这个问题,人们提出了一种新型的IT技术发展、部署以及商业模式,这就是云计算技术。目前,云计算技术已经在网络存储、搜索引擎、分布式计算、电子商务、社交网络等多个领域获得了广泛应用,并且取得了快速发展。但是,云计算还没有一个权威性的定义和统一的标准,各大IT公司都在各自的业务领域独自研究。搜索引擎是互联网行业中进行大规模数据处理的前沿领域,云计算技术在它的发展过程中将会发挥不可替代的作用。同时传统的搜索引擎采用关键字匹配的技术进行检索,不能在真正理解用户查询意图的基础上进行搜索,缺乏语义性。因此,将云计算技术和语言处理技术运用到搜索技术中来,对搜索引擎进行改进,将是一个很好的方法。本课题在介绍研究了云计算和搜索技术的基础上,讨论了传统搜索技术的缺点和不足。从研究和设计的角度出发,研究了一种基于云计算的分布式语义搜索方法,并着重对基于云计算的分布式存储系统(CDSS)进行深入的研究与设计。本课题研究工作的先进性主要体现在以下三个方面:(1).建立了一种基于虚拟环的consistent hashing数据分布和定位算法。利用该算法,系统将加快对数据的存储和访问,同时提高系统的均衡负载能力。(2).提出了全分布式的数据备份方案。通过该方案,系统可以依托DHT网络的优势,实现数据副本的快速同步与更新,提高数据的可用性、可靠性以及安全性。(3).提出了基于CDSS的语义搜索算法。通过在基于云计算的分布式存储系统上覆盖语义层,从而在DHT网络中实现语义搜索。
论文目录
摘要ABSTRACT第一章 引言1.1 选题的背景1.2 搜索技术概述1.2.1 国内外搜索技术研究1.2.2 传统搜索技术存在的问题1.2.3 搜索技术的趋势1.3 研究的内容及意义1.3.1 研究内容及组织结构1.3.2 研究的意义第二章 相关理论与技术2.1 搜索引擎概述2.1.1 理论基础2.1.2 搜索引擎分类及特点2.1.3 搜索引擎的工作原理与数据特点2.2 云计算概述2.2.1 云计算的基本概念2.2.2 云计算平台架构及分类2.2.3 云计算的特点与优势2.3 分布式存储技术2.3.1 基于P2P 的分布式存储2.3.2 基于神经网络的分布式存储2.3.3 Google File System 文件系统2.4 本章小结第三章 CDSS 系统的需求与设计3.1 系统需求分析3.1.1 功能需求3.1.2 非功能需求3.2 通信服务协议3.3 系统的设计3.3.1 数据分配策略3.3.2 副本同步与迁移3.3.3 轻量级的Auxiliary Server3.3.4 路由表3.3.5 容错处理与恢复3.4 系统的不足和需要改进的地方3.5 本章小结第四章 基于CDSS 的分布式语义搜索的研究与设计4.1 搜索技术现状与CDSS 系统的运用4.1.1 搜索技术现状4.1.2 CDSS 在语义搜索引擎中应用场景4.2 主要思想与设计框架4.3 工作流程与算法的设计与细节4.3.1 系统工作流程4.3.2 算法流程4.3.3 算法实现细节4.4 本章小结第五章 模拟实验与分析5.1 实验目的与实验环境5.2 测试的主要功能与实验5.2.1 实验15.2.2 实验25.2.3 实验35.3 本章小结第六章 总结与展望6.1 本文总结6.2 研究展望致谢参考文献攻硕期间参与的科研项目
相关论文文献
标签:云计算论文; 分布式存储论文; 数据分布算法论文; 文本距离算法论文; 语义搜索论文;