一种分布式的互联网信息雷达系统的设计与实现

一种分布式的互联网信息雷达系统的设计与实现

论文摘要

随着互联网的迅速发展,互联网上的信息也以爆炸性的速度增长着。人们每天为了获得最新的感兴趣信息,不得不花费大量的时间在众多的网站之间苦苦寻觅,因此人们需要一种实时的信息采集和发布的信息索引系统,我们把它称为互联网信息雷达系统(简称 IIRS)。IIRS的基本功能就是跟踪和监控最新的网络信息,进而建立实时的信息资源库,并提供信息索引和检索服务。IIRS可以为用户提供一个跨门户的信息平台,具有即时、全面、客观、个性化的特征,同时它也为管理者建构了一个可再加工利用的信息资源库。 本文设计了一个功能比较完备的IIRS模型,首先用UML 2.0对IIRS系统建模,然后采用VS.NET 2005和SQL Server 2005来实现信息采集,智能过虑,自动分类,自动发布,并行模糊查询,分布式的数据同步更新,RSS馈送汇集器等系统功能。其中着重介绍了分布式的信息实时采集技术,以及分布式的并行模糊查询技术。最后以IIRS的模型为基础实现了一个免费提供“个人信息中心”服务的网站(MyIC.cn),使得网站能满足用户的需要,并且提供个性化的服务。 为了得到更有效的查询结果,我们整合了中科院的研究成果ICTCLAS提供的中文分词功能。经过测试,并行模糊查询功能确实能够部分的做到理解用户的查询意图,同时也提高了查询速度。根据系统的测试数据,我们还提出了如何讲一步完善的方法。

论文目录

  • 第一章 绪论
  • 1.1 研究目的
  • 1.2 国内外研究现状和发展趋势
  • 1.3 研究意义
  • 1.4 系统架构的选择
  • 1.5 VS.NET技术介绍
  • 1.6 术语说明
  • 1.7 本论文的组织结构
  • 1.8 本章小结
  • 第二章 技术与工具平台
  • 2.1 技术与工具平台选择
  • 2.2 UML与RATIONAL SOFTWARE
  • 2.3 VISUAL STUDIO.NET 2005
  • 2.4 MICROSOFT WINDOWS SERVER 2003 ENTERPRISE EDITION SP1
  • 2.5 MICROSOFT SQL SERVER 2005 CTP
  • 2.6 MICROSOFT ⅡS 6.0
  • 2.7 VISUAL C#.NET, VISUAL BASIC.NET, ASP.NET
  • 2.8 NDOC
  • 2.9 NUNIT 2.2
  • 2.10 .NET REFLECTOR
  • 2.11 INSTALL SHIELD X 10.0 PREMIER EDITION SP1
  • 2.12 本章小结
  • 第三章 ⅡRS体系结构及系统设计
  • 3.1 ⅡRS体系结构
  • 3.2 采集系统模块的类图
  • 3.2.1 控制“网络蜘蛛”的多线程工作的类图
  • 3.2.2 记录连接的Uri类图
  • 3.2.3 描述“网络蜘蛛”的任务类图
  • 3.2.4 分析HTML的类图
  • 3.3 发布网站以及查询系统的设计
  • 3.3.1 ASP.NET Web服务
  • 3.3.2 .NET Remoting技术
  • 3.3.3 分布式编程模型的选择
  • 3.3.4 并行查询客户端的类图
  • 3.3.5 并行查询服务器端的类图
  • 3.4 本章小结
  • 第四章 系统实现
  • 4.1 信息采集模块
  • 4.1.1 信息采集模块的功能结构
  • 4.1.2 用C#语言构造蜘蛛程序
  • 4.1.3 利用正则表达式来智能过虑网页
  • 4.2 数据库查询模块
  • 4.2.1 分布式数据库系统
  • 4.2.2.NET Remoting技术的处理过程
  • 4.2.3.NET Remoting的服务器对象
  • 4.2.4 ADO.NET管理数据一致性
  • 4.2.5 分布式数据库系统的实现
  • 4.3 本章小结
  • 第五章 关键问题和难点
  • 5.1 查询控制客户端的实现
  • 5.1.1 查询线程
  • 5.1.2 并行查询线程的同步
  • 5.2 模糊查询的实现
  • 5.3 各数据库的同步更新
  • 5.3.1 数据复制的概念
  • 5.3.2 SQL Server数据复制的原理
  • 5.3.3 SQL Server数据复制的步骤
  • 5.3.4 SQL Server数据复制的验证
  • 5.4 创建网站RSS内容摘要
  • 5.5 本章小结
  • 第六章 系统测试及其它特点分析
  • 6.1 MYIC.CN网站的测试过程
  • 6.1.1 运行准备
  • 6.1.2 MylC.cn的查询界面
  • 6.1.3 并行查询结果
  • 6.1.4 并行查询的结果分析
  • 6.2 影响系统性能的因素
  • 6.3 MYIC.CN网站为提高性能而采取的措施
  • 6.3.1 提高网络蜘蛛的速度和兼容性
  • 6.3.2 改善并行查询的性能
  • 6.3.3 改善应用服务器的用户体验
  • 6.4 IIRS的其他特性
  • 6.5 本章小结
  • 总结展望
  • 参考文献
  • 附录1 “网络蜘蛛”的主界面类图
  • 附录2 查询控制客户端的设置界面类图
  • 附录3 查询控制客户端的主界面类图
  • 附录4 SERVER LOADER的主界面类图
  • 相关论文文献

    • [1].如何让“互联网+”农业的现实不再骨感[J]. 中国商界 2016(07)
    • [2].中国邮政“互联网+”战略探秘[J]. 中国邮政 2015(10)
    • [3].顺应潮流 抢占“互联网+”制高点[J]. 中国邮政 2015(10)
    • [4].“互联网+”驱动邮政变革的思路与对策[J]. 中国邮政 2015(10)
    • [5].中国经济新动力:互联网+零售[J]. 中国商界 2015(08)
    • [6].互联网+改变低效[J]. 中国商界 2015(09)
    • [7].互联网+零售新机遇[J]. 中国商界 2015(09)
    • [8].打造互联网零售的高速公路[J]. 中国商界 2015(09)
    • [9].互联网与实体经济奔流相汇[J]. 中国商界 2015(09)
    • [10].互联网+零售=互联网+品牌[J]. 中国商界 2015(09)
    • [11].互联网+的人力资源管理[J]. 中国商界 2015(07)
    • [12].中国互联网繁荣背后的隐忧[J]. 小康 2014(12)
    • [13].传统行业基于互联网创新的一些思考[J]. 中国商界 2015(Z1)
    • [14].“互联网+”便利店的发展方向[J]. 中国商界 2015(06)
    • [15].回归商业本质是最大的互联网思维[J]. 中国商界 2015(Z1)
    • [16].给互联网金融风险提个醒[J]. 消费者报道 2014(03)
    • [17].移动互联网对国际经济贸易产生的影响[J]. 科技资讯 2019(31)
    • [18].互联网20年变迁记[J]. 中国科技奖励 2019(05)
    • [19].基于互联网+的智慧城市解决方案研究[J]. 科技风 2019(35)
    • [20].互联网订餐食品安全监管模式[J]. 食品与机械 2019(11)
    • [21].试谈互联网企业的管理及发展模式借鉴[J]. 企业科技与发展 2019(11)
    • [22].区块链和能源互联网:天作之合[J]. 中外能源 2019(12)
    • [23].试论工业互联网与消费互联网的本质区别[J]. 门窗 2019(12)
    • [24].工业互联网[J]. 机电工程技术 2019(11)
    • [25].共享经济在互联网+时代下的发展现状及对策研究[J]. 四川建材 2019(12)
    • [26].互联网大数据时代下教学转变探析[J]. 湖北农机化 2019(23)
    • [27].试论互联网对财务会计的影响[J]. 福建茶叶 2019(10)
    • [28].基于互联网+模式的医疗服务“最多跑一次”改革实践[J]. 中医药管理杂志 2019(23)
    • [29].关于推动互联网+药品监管的思考[J]. 中国医药工业杂志 2019(11)
    • [30].医院互联网+党建平台构建中的思考[J]. 学理论 2019(12)

    标签:;  ;  ;  ;  ;  

    一种分布式的互联网信息雷达系统的设计与实现
    下载Doc文档

    猜你喜欢