论文摘要
伴随着互联网的普及和网络信息的爆炸式增长,人们查阅资料己不是依靠有限范围内的网站来寻找,而是依靠搜索引擎对信息海洋中的海量数据进行访问了。搜索引擎技术已经成为互联网发展必不可少的核心技术,它的作用越来越重要。然而现有的搜索引擎大多是集中式的,已经不能很好地适应网络的进一步发展,分布式技术是下一代搜索引擎的发展趋势。本文在分析传统搜索引擎技术不足的基础上,提出一种基于MPI(Message Passing Interface)的分布式搜索引擎系统。该系统主要由并行网页抓取和分布式建立索引两部分组成。首先,详细介绍了网页并行抓取的设计和实现,包括它的系统框架、主要模块、运行流程和URL调度算法。URL调度算法采用散列计算,不仅实现了负载平衡,而且在一定程度上避免了冲突。然后,通过分析索引数据库在搜索引擎时效性及有效性方面的重要作用,提出一种多进程并行分词建立索引的方法。该方法以中文网页数据库为基本语料库,采用正向最大匹配法进行中文分词,并用一种高效的倒排索引方式存储索引表。这种方法能够加快索引建立与更新的速度,并且在空间效率上也有较大的提高。分布式中文搜索引擎架设在基于MPI的分布式网络结构之上,利用MPI良好的分布式特性,使搜索引擎从集中式走向分布式。采用静态和动态相结合的任务分配策略,提高了时间和空间效率并使系统易于扩展,实现了网页快速抓取和索引的建立与更新。该搜索引擎能更深度、更广度地搜索互联网上用户可用的信息,更准确、更迅速的返回用户查询结果。
论文目录
相关论文文献
- [1].并行计算与MPI研究[J]. 无线互联科技 2017(12)
- [2].MPI并行计算应用[J]. 信息通信 2015(08)
- [3].三值光学计算机MPI编程技术在超算集群中的使用[J]. 上海大学学报(自然科学版) 2014(02)
- [4].基于ActiveX和MPI优化注射成型保压压力[J]. 模具工业 2009(05)
- [5].基于MPI的分布式水循环模型并行计算性能研究[J]. 水文 2020(05)
- [6].基于MPI的注塑模浇口位置优化设计[J]. 模具技术 2011(03)
- [7].Mpi-空间与偏序集[J]. 数学学报 2011(06)
- [8].面向MPI集合操作的定制化片上网络[J]. 计算机工程 2017(06)
- [9].基于MPI的分水岭与区域合并结合算法的并行化研究[J]. 电脑编程技巧与维护 2017(13)
- [10].基于MPI的注塑模具计算机辅助技术研究[J]. 塑料工业 2015(11)
- [11].MPI并行的节点大地电磁三维有限元正演[J]. 物探化探计算技术 2016(03)
- [12].基于天河互连MPI聚合通信归约操作卸载优化[J]. 计算机工程与科学 2020(11)
- [13].MPI技术在胶州湾水质预报系统的应用研究[J]. 计算机工程与设计 2013(06)
- [14].基于MPI的地下水数值模拟并行算法研究[J]. 安徽农业科学 2012(12)
- [15].基于MPI的并行程序设计[J]. 中国新技术新产品 2011(20)
- [16].基于MPI的注塑成型熔接痕分析及优化[J]. 机械设计与制造 2008(06)
- [17].基于可控源音频大地电磁二维反演的MPI并行算法研究[J]. 科学技术与工程 2016(31)
- [18].一种基于MPI的河流生态修复模拟并行算法[J]. 地学前缘 2014(04)
- [19].基于MPI二次开发及正交试验的注塑制品熔接痕性能的优化设计[J]. 模具技术 2012(01)
- [20].基于MPI的静态并行算法库[J]. 中国西部科技 2011(14)
- [21].基于MPI的海量数据线性拟合并行算法研究[J]. 南京师大学报(自然科学版) 2010(04)
- [22].MPI并行计算性能的研究[J]. 四川大学学报(自然科学版) 2009(06)
- [23].基于MPI和正交试验的翘曲变形研究[J]. 塑料科技 2017(11)
- [24].分布式存储系统中基于MPI的并行计算编程模型[J]. 价值工程 2012(36)
- [25].基于MPI的并行医学图像处理[J]. 计算机工程与科学 2009(03)
- [26].基于MPI的典型西南山区耕地空间分布影响因素研究——以重庆石柱县为例[J]. 水土保持研究 2014(02)
- [27].基于MPI的三维波动方程有限元法并行正演模拟[J]. 石油物探 2009(03)
- [28].一种MPI并行编程教学实验环境系统的架构[J]. 实验技术与管理 2008(04)
- [29].基于MPI百万级家庭网关模拟的设计与实现[J]. 计算机工程与设计 2017(09)
- [30].基于MPI的时间域激发极化法2.5维正则化并行反演[J]. 地球物理学进展 2015(06)