Print

基于P2P平台的自然语言搜索系统的研究

论文摘要

对等网(P2P)技术现在已经成为了人们研究的一个热门技术,BT、PPLive等P2P软件的使用日益频繁,新的应用也随着研究的深入而不断出现。本文就是在这样的背景下提出的,主要研究基于P2P平台的数据搜索技术。目前的网络搜索技术大多是基于服务器的。而此类搜索引擎虽然速度较快,但是资源的搜索率却是很低的,通常有效涵盖面只是网络中的网页文件,而P2P则可以深度搜索网络资源,提高网络资源的利用率。本文由此提出了一个这样的想法:能不能在对等网上进行直接的搜索,让网络使用者直接输入查询语句(而不是仅仅靠关键字),就能检索到所要的信息。为了实现这个思想,本文把一个自然语言分词模块嵌入到P2P平台里面,同时设计了一个与这个分词模块相对应的文件系统。为了减少查询消息的传播路径数目,作者参考半分布式网络平台,设计了一个新的P2P网络拓扑结构和相应的算法。最后在上述研究的基础上,作者设计了一个小的验证系统来检验本文提出的思想。

论文目录

  • 摘要
  • ABSTRACT
  • 第一章 引言
  • 1.1 目前网络搜索引擎介绍
  • 1.2 对等网络
  • 1.3 基于对等网络的搜索的研究意义
  • 1.4 自然语言搜索
  • 1.5 本文的研究内容
  • 第二章 P2P 基础平台设计
  • 2.1 P2P 定义及其技术特点
  • 2.1.1 P2P 定义
  • 2.1.2 P2P 技术特点
  • 2.2 P2P 拓扑结构
  • 2.2.1 P2P 拓扑结构简介
  • 2.2.2 各种网络拓扑结构及其典型的应用
  • 2.2.3 各种网络拓扑比较
  • 2.3 GNUTELLA 协议分析
  • 2.3.1 协议定义
  • 2.3.2 路由算法
  • 2.4 基于自然语言的 P2P 基础平台设计
  • 2.4.1 网络拓扑结构定义
  • 2.5 网络协议设计
  • 2.5.1 节点的行为分析
  • 2.5.2 网络协议设计
  • 2.5.3 节点路由算法
  • 第三章 P2P 通信机制
  • 3.1 WINDOWS SOCKETS
  • 3.1.1 Windows Sockets 规范
  • 3.1.2 Winsock 套接字
  • 3.1.3 UDP 协议和 IP 多播
  • 3.2 P2P 通信概述
  • 3.2.1 NAT 工作原理
  • 3.3 P2P 基础通信技术
  • 3.3.1 P2P 中转技术
  • 3.3.2 P2P 反向连接技术
  • 3.3.3 UDP 打洞技术
  • 3.4 基于 NLTP 的 P2P 通讯设计
  • 第四章 自然语言搜索算法设计和实现
  • 4.1 引言
  • 4.2 汉语自动分词存在的困难
  • 4.3 分词系统的任务和评估方法
  • 4.4 目前比较常用的分词技术
  • 4.4.1 基本分词算法
  • 4.5 一种改进的 MM 算法
  • 4.5.1 改进的 MM 算法实现
  • 4.5.2 分词算法词库设计
  • 第五章 验证系统设计和测试
  • 5.1 系统框架设计
  • 5.1.1 系统功能模型
  • 5.2 系统各个模块介绍
  • 5.2.1 覆盖网网络平台
  • 5.2.2 网络交互控制模块
  • 5.2.3 文件系统管理器模块
  • 5.2.4 自然语言查询器模块
  • 5.2.5 文件传输器模块
  • 5.2.6 域管理器模块
  • 5.3 验证系统测试
  • 第六章 总结与展望
  • 6.1 总结
  • 6.2 展望
  • 致谢
  • 参考文献
  • 在学期间的研究成果及发表的学术论文
  • 相关论文文献

    本文来源: https://www.lw50.cn/article/fd5328a7d8d440412e5d04f7.html