专业搜索引擎中文件服务系统设计与实现

专业搜索引擎中文件服务系统设计与实现

论文摘要

为了满足化工领域专业搜索的需求,我们研究室开发了化工专业搜索引擎。该搜索引擎需要对大量的文件做读写操作,这会消耗大量的系统时间,从而显著降低了搜索引擎的工作效率。因此,有必要开发专用的文件服务系统,为搜索引擎提供高速的文件读写服务。 本文设计并实现了化工专业搜索引擎专用的文件服务子系统,该子系统能够响应来自搜索引擎的文件读写请求,从而为搜索引擎提供高速的文件读写服务。该系统采用基于JAVA平台的分布式对象技术RMI实现,使用压缩打包的方式对文件进行存储和管理。有效地满足了搜索引擎对文件操作的需求。 该搜索引擎已经实现了对HTML文件的解析,但是还需要对网上许多其他不同类型的文件进行解析,以实现对这些文件的索引,从而使用户通过使用该搜索引擎能够检索到这些文件资源。本文继续这方面的开发又实现了对Excel文件的解析,为对这种类型的文件进行索引创造了条件。 以上代码均经过测试,可以稳定运行。文件服务子系统的实现对化工专业搜索引擎性能的提高有着较为明显的作用。而对Excel文件解析的实现则进一步完善了该搜索引擎的文件处理器的文件解析功能。

论文目录

  • 符号说明
  • 第一章 绪论
  • 1.1 课题背景
  • 1.1.1 搜索引擎简介
  • 1.1.2 专业搜索引擎
  • 1.1.3 文件服务系统
  • 1.2 本课题的主要研究内容和意义
  • 1.2.1 问题的提出
  • 1.2.2 主要研究内容
  • 1.2.3 主要意义
  • 1.3 论文的基本结构介绍
  • 第二章 一些相关理论知识的介绍
  • 2.1 Microsoft网络的文件共享服务
  • 2.1.1 和文件服务相关的通讯协议
  • 2.1.2 Microsoft网络中文件共享访问的两种方式
  • 2.2 分布式对象技术
  • 2.2.1 COM/DCOM
  • 2.2.2 RMI(远程方法调用)
  • 2.2.3 CORBA(通用对象请求代理体系结构)
  • 2.2.4 Web Service
  • 2.3 LZSS压缩算法
  • 第三章 文件服务系统的设计与实现
  • 3.1 文件服务系统的整体框架设计
  • 3.1.1 在设计过程中所遇到的问题
  • 3.1.2 总体框架设计
  • 3.2 文件服务系统的接口设计
  • 3.3 文件服务系统服务器端设计
  • 3.3.1 文件压缩和解压缩的LZSS算法实现
  • 3.3.2 文件服务系统的结构
  • 3.3.3 文件读写删操作的实现
  • 3.3.4 对该系统文件删除方式的改进
  • 3.3.5 用于文件服务系统服务器查看和管理的图形用户界面(GUI)设计
  • 3.3.6 服务器的启动运行
  • 3.4 文件服务系统的客户端设计
  • 3.4.1 客户端的框架设计
  • 3.4.2 相关类的说明
  • 3.4.3 多线程访问的实现方法
  • 第四章 Excel格式文件解析
  • 4.1 搜索引擎文件处理器的架构
  • 4.1.1 功能结构
  • 4.1.2 类结构设计描述
  • 4.2 Excel格式文件解析
  • 4.2.1 POI简介
  • 4.2.2 类结构设计描述
  • 4.2.3 XlsParserThread类中Excel文件解析的实现
  • 第五章 总结与展望
  • 5.1 论文主要工作概述
  • 5.2 有待继续研究的内容
  • 参考文献
  • 致谢
  • 攻读学位期间发表的学术论文目录
  • 相关论文文献

    • [1].“互联网+”环境下我国电子文件服务方式变革研究[J]. 北京档案 2018(05)
    • [2].基于RBAC的网络文件服务系统设计与实现[J]. 微计算机应用 2010(02)
    • [3].独具特色的文件服务方案:IBRIX[J]. 中国数字电视 2008(Z1)
    • [4].东方通文件服务平台助力银行业[J]. 金融电子化 2014(02)
    • [5].现行文件服务存在的问题及对策[J]. 兰台内外 2014(05)
    • [6].现行文件服务模式浅析[J]. 黑龙江档案 2012(06)
    • [7].负载均衡的集群文件分发与下载服务设计[J]. 计算机与网络 2018(14)
    • [8].集群文件服务系统中的负载均衡算法的研究[J]. 计算机工程与设计 2013(08)
    • [9].东芝整合文件服务打造行业先驱[J]. 瞭望 2010(31)
    • [10].规范性文件服务经济建设研究[J]. 中共贵州省委党校学报 2012(05)
    • [11].活动[J]. 商务旅行 2011(02)
    • [12].适用于电网调度的一种基于日志的高可靠文件服务[J]. 江苏科技信息 2013(19)
    • [13].以创新引领行业销量——东芝整合文件服务打造行业先驱[J]. 经理人 2010(09)
    • [14].东芝整合文件服务打造行业先驱[J]. 创业邦 2010(09)
    • [15].创建高价值沟通平台 助力企业解决经营难题[J]. 个人电脑 2014(01)
    • [16].IDC打印管理服务最新报告:施乐和富士施乐位列第一[J]. 计算机与网络 2010(20)
    • [17].爱普生助力南京华务光盘刻录印刷业务新增长[J]. 机械制造 2010(08)
    • [18].IDC:施乐和富士施乐打印管理服务位列第一[J]. 办公自动化 2010(21)
    • [19].2013年存储行业8大预测[J]. 通讯世界 2013(01)
    • [20].数字[J]. 数码印刷 2009(01)
    • [21].看国外怎样用公车[J]. 决策探索(上半月) 2014(11)
    • [22].做好现行公开文件服务 拓展档案服务功能[J]. 兰台内外 2010(01)
    • [23].福禄克技术服务园地(11) 以太网验收技术(二)[J]. 铁路计算机应用 2009(11)
    • [24].东方通文件服务平台 助推保险业数据整合[J]. 金融电子化 2013(09)
    • [25].夯实基础 优化配置[J]. 信息方略 2009(12)
    • [26].简讯[J]. 数码印刷 2010(01)
    • [27].Web Archive存档策略分析[J]. 现代图书情报技术 2009(01)
    • [28].QoS在网络中的应用[J]. 科技广场 2011(06)
    • [29].利用客户关系管理技术改进档案服务质量[J]. 四川档案 2010(01)
    • [30].用DAC管好文件权限[J]. 网络安全和信息化 2017(10)

    标签:;  ;  ;  ;  ;  ;  

    专业搜索引擎中文件服务系统设计与实现
    下载Doc文档

    猜你喜欢