面向企业应用的网络信息搜索机器人的设计与实现

面向企业应用的网络信息搜索机器人的设计与实现

论文摘要

现在,有一类被称为网络机器人的软件系统在Internet 上的应用越来越广泛。网络机器人就象在流水线上工作,不断焊接同样装置的机器人一样,它们被程序控制在网络上反复执行同样的任务。由于网络机器人的实用性,引起了很多程序员,特别是Web 程序员的兴趣。本文所要介绍的网络信息搜索机器人就是网络机器人的一种。现在大型网络信息搜索机器人应用非常广泛,最典型的例子就是搜索引擎(如Google, Baidu, Yahoo 等)。当用户需要在广阔的Internet 寻找特定信息时,这些搜索引擎非常有用处,但针对一些特殊的,细节的情况时,这种大型网络信息搜索机器人就显得不合时宜,甚至常常得不到希望的结果。例如,某跨国公司有一个强大的内部网站,里面有一些对公司内部非常有用但不能对外公布的信息,这时当公司一个成员想得到相应的信息时,他通过Internet 上的大型网络信息搜索机器人显然束手无策,只能通过浏览网页得到他想要的信息,而这些信息常常又分布在毫无关系的很多网页上。这样查找起来不仅很慢,而且也不一定能把有效信息收集齐全。由此可见,现有的搜索引擎并不能用于在公司内部网站上搜索有效的信息,因此,还需要能够适应企业内部搜索应用的中小型网络信息搜索机器人。根据本人的关注,现在还没有很成体系的提供给企业内部使用的网络信息搜索机器人。由于以上的需求,我在Motorola 成都软件中心作为核心成员设计并实现了文中将要介绍的面向企业应用的网络信息搜索机器人,并给它取了一个很酷的名字:Crazy Info Collector(文中简称为CIC)。本文主要介绍了整个CIC系统的设计与实现过程,从系统总体架构到各重要模块的分析。CIC 系统具有非常重要的普遍意义,它可以应用于任何需要内部网页搜索功能的企业。当一个企业需要内部网页搜索功能时,它可以选择不重新开发搜索系统,而是通过修改CIC 系统或直接复用该系统来满足自己的需要。相信随着CIC 系统的不断升级及功能增强,它将会变得越来越强大,给需要该应用的企业带来越来越多的方便。CIC 系统是用Java 语言来开发的,集成开发环境使用的是Eclipse,数据库使用的是MySQL 数据库。CIC 系统涉及到了Java 编程和面向对象技术的很多方面:GUI 编程,数据库编程,网络编程,多线程编程,设计模式,Cache设计等等。本文首先对整个CIC 系统的总体架构以及核心类Spider 类进行了介绍,然后介绍了用设计模式构建的两个系统子模块,紧接着对系统的多线程模块、数据库模块、Cache 管理模块分章节进行了详细介绍,最后进行总结。

论文目录

  • 摘要
  • Abstract
  • 目录
  • 第一章 绪论
  • 1.1 网络机器人的概念
  • 1.2 网络信息搜索机器人的现状
  • 1.3 论文完成的工作
  • 第二章 CIC 系统的总体架构及 Spider 类的设计
  • 2.1 UML 类图简要介绍
  • 2.1.1 类和对象
  • 2.1.2 三个层次的观点
  • 2.1.3 什么时候使用类图
  • 2.1.4 类图中的关系及类图元语小结
  • 2.2 CIC 的体系结构
  • 2.2.1 CIC 的总体架构类图
  • 2.2.2 各类之间的关系分析
  • 2.3 CIC 系统主流程和Spider 类的构造
  • 2.3.1 CIC 系统主流程
  • 2.3.2 Spider 类的结构
  • 2.3.3 用Spider 程序建立 CIC 系统的网页队列
  • 第三章 用设计模式构建 CIC 系统中的重要模块
  • 3.1 组合模式及其在CIC 中的具体应用
  • 3.1.1 组合模式(Composite)介绍
  • 3.1.2 组合模式在CIC 中的应用
  • 3.2 静态工厂方法模式及其在CIC 中的具体应用
  • 3.2.1 静态工厂方法模式(Static Factory Method)介绍
  • 3.2.2 静态工厂方法模式在CIC 的应用
  • 第四章 多线程下载模块的设计与实现
  • 4.1 Java 多线程编程介绍
  • 4.1.1 何谓多线程
  • 4.1.2 POSIX 多线程模型
  • 4.1.3 多线程同步问题
  • 4.1.4 同步变量
  • 4.2 Java 多线程在CIC 中的应用
  • 4.2.1 多线程下载类的设计
  • 第五章 数据库相关模块的设计与实现
  • 5.1 MySQL 数据库及SQL 相关知识介绍
  • 5.1.1 MySQL 数据库
  • 5.1.2 SQL 语言
  • 5.1.3 使用 JDBC 操作数据库
  • 5.2 数据库结构设计
  • 5.2.1 主关键字表SearchRecord 设计
  • 5.2.2 Cache 管理表 CacheManager 和元素表 CacheElement设计
  • 5.2.3 队列管理表 SqlEnque 设计
  • 5.3 MySQL 操作类的设计与实现
  • 第六章 Cache 管理模块的设计与实现
  • 6.1 Cache 管理模块管理机制设计
  • 6.2 Cache 管理类的设计与实现
  • 第七章 总结
  • 致谢
  • 参考文献
  • 个人简历
  • 相关论文文献

    • [1].高校Y一代用户网络信息搜索行为研究[J]. 科技情报开发与经济 2015(08)
    • [2].网络信息搜索行为捕获系统的设计与关键技术[J]. 教育信息技术 2017(Z1)
    • [3].用户认知导向的网络信息搜索模型研究述评[J]. 图书情报工作 2013(17)
    • [4].模糊容忍性对网络信息搜索绩效的影响:信息迷航的中介作用[J]. 心理与行为研究 2018(02)
    • [5].货物跟踪信息集成平台中的网络信息搜索算法设计[J]. 科技广场 2015(02)
    • [6].西安国内游客旅游网络信息搜索行为研究[J]. 经济地理 2010(07)
    • [7].期刊编辑的网络信息搜索技巧[J]. 长江大学学报(社会科学版) 2010(04)
    • [8].什么是“人肉搜索”[J]. 金秋 2009(02)
    • [9].基于网络信息搜索的旅游需求预测——来自黄金周的证据[J]. 系统管理学报 2014(03)
    • [10].驴友网络信息搜索行为及其对出游决策影响分析——以西安驴友为例[J]. 干旱区资源与环境 2013(06)
    • [11].校园网搜索引擎研究与实现[J]. 才智 2017(08)
    • [12].网络信息搜索匹配算法研究与仿真[J]. 计算机仿真 2012(04)
    • [13].学生网络信息搜索策略选择的差异分析[J]. 情报资料工作 2014(05)
    • [14].“人肉搜索”:一把锋利的双刃剑[J]. 作文成功之路(高中版) 2008(12)
    • [15].提高网络信息搜索匹配准确率的相关研究[J]. 科技资讯 2012(31)
    • [16].谁该为人肉搜索侵权买单[J]. 法律与生活 2009(22)
    • [17].人肉搜索,袭击了谁的隐私[J]. 涉世之初 2008(11)
    • [18].“人肉搜索”让你无处遁形[J]. 江淮法治 2008(20)
    • [19].基于场景测试的高校学生网络信息搜索能力评价[J]. 图书情报知识 2011(03)
    • [20].很有能耐的人肉搜索[J]. 中学生数理化(八年级数学)(人教版) 2008(Z3)
    • [21].师生同行,共同提升网络信息搜索能力[J]. 科学大众(科学教育) 2013(10)
    • [22].人肉搜索:网络时代的群体癫狂[J]. 军事记者 2010(08)
    • [23].人肉搜索[J]. 农村工作通讯 2009(04)
    • [24].基于大学生网络信息搜索行为的搜索引擎评价指标体系的构建[J]. 技术与市场 2009(08)
    • [25].大学生网络信息搜索能力的调查研究[J]. 网络财富 2008(11)
    • [26].网络爬虫技术的发展趋势[J]. 科技信息 2010(12)
    • [27].网络信息搜索行为影响因素研究:基于高校学生的实证[J]. 图书情报工作 2012(06)
    • [28].翻译在线信息搜索能力量表的研制及检验[J]. 外国语(上海外国语大学学报) 2020(05)
    • [29].从舆论形成看“人肉搜索”[J]. 新闻窗 2009(04)
    • [30].基于移动Agent的信息搜索系统的研究[J]. 计算机工程与设计 2008(20)

    标签:;  ;  ;  ;  

    面向企业应用的网络信息搜索机器人的设计与实现
    下载Doc文档

    猜你喜欢