Web资源采集与保存研究

Web资源采集与保存研究

论文题目: Web资源采集与保存研究

论文类型: 硕士论文

论文专业: 档案学

作者: 杨道玲

导师: 刘家真

关键词: 网络资源,数字信息,文化遗产,采集,保存

文献来源: 武汉大学

发表年度: 2005

论文摘要: 随着计算机和通信技术的飞速发展,网络已成为我们这个世界重要信息源之一和主要的信息传播媒介。作为全球最大的信息资源库,Web资源日益成为我们文化遗产的重要组成部分。然而,Web资源的寿命是极其短暂的,在新的网页不断产生的同时,旧的网页也在不断地消失。因此如何采集与保存Web文化遗产是我们共同面临的严峻挑战。 Web资源采集与保存是一项庞大的系统工程,它涉及到政府、出版、教育、科技、文献保存等许多部门,面临着文化、技术、资金、法律、管理体制等诸多方面的问题。目前已有许多国家进行了有益的尝试,但总体上仍处于探索阶段。我国的Web资源保存实践也才刚刚起步,尚存在大量的课题需要研究。 本文是国家自然科学基金项目“中国文化数字资源保存库的国家战略研究’’(刘家真主持,编号:70373048)的子课题之一,笔者先介绍了Web与Web资源的现状,接着重点论述了Web资源的采集策略以及Web资源保存的挑战与对策,然后对国内外相关领域的典型案例进行比较分析,最后介绍了Web资源保存研究的发展趋势,并在总结与借鉴的基础上提出“中国Web资源保存计划”——建立中国Web档案馆的初步构想。

论文目录:

中文摘要

英文摘要

引言:Web资源保存——数字遗产保护的新课题

1 Web与Web资源

1.1 Web概述

1.2 与Web相关的几个问题

1.2.1 Web的特点

1.2.2 Web的动态性

1.2.3 静态网页与动态网页

1.2.4 Web搜索引擎

1.3 Web资源概述

1.3.1 Web资源的种类

1.3.2 Web资源的特点

2 Web资源采集策略

2.1 采集范围与对象

2.1.1 确定采集级别

2.1.2 划定归档Web空间

2.1.3 采集内容的甑选

2.2 采集/获取方式

2.2.1 被动获取

2.2.2 主动获取

2.3 采集频率

2.3.1 确定采集频率

2.3.2 评估网页重要性及内容相关性

2.4 深层网页的获取

2.5 本章小结

3 保存Web资源:挑战与对策

3.1 技术问题

3.1.1 采集技术

3.1.2 存储技术

3.1.3 Web资源的长期保存

3.1.4 访问与安全控制

3.2 法律问题

3.2.1 采集中涉及的法律问题

3.2.2 保存中的法律问题

3.2.3 利用中的法律问题

3.2.4 Web资源保存实践中应采取的法律措施

3.3 资金问题

3.4 组织与管理

3.4.1 划分责任体系

3.4.2 建立合作机制

3.5 本章小结

4 国际Web资源保存行动评述

4.1 美国Internet档案馆

4.2 基于选择性采集的项目

4.2.1 澳大利亚Pandora项目

4.2.2 美国Minerva模型

4.2.3 英国Britain on the Web项目

4.2.4 德国海德堡大学的汉学研究数字档案馆(DACHS)

4.3 基于自动获取的全采集项目

4.3.1 奥地利AOLA项目

4.3.2 瑞典Kulturarw3项目

4.3.3 欧洲The NEDLIB项目

4.3.4 芬兰EVA项目

4.3.5 挪威Paradigma项目

4.4 联合采集:法国BnF项目

4.5 其他行动

4.6 本章小结

5 中国Web资源保存行动评述

5.1 中国国家图书馆网络信息资源保存试验项目

5.1.1 Web资源采集与保存试验项目WICP

5.1.2 网络数据库导航项目ODBN

5.2 中国Web信息博物馆

5.3 中文数字财富大全库CDAL

5.4 其他相关行动

5.5 本章小结

6 Web资源保存的研究趋势与展望

6.1 研究趋势

6.2 中文Web资源现状及评价

6.3 关于建立中国Web档案馆的初步构想

6.3.1 必要性

6.3.2 可行性

6.3.3 建设策略

6.4 本章小结

结语:保存Web资源,守护时代记忆

参考文献

1 国内文献

2 国外文献

后记

发布时间: 2006-03-27

参考文献

  • [1].基于WEB的数字参考咨询系统的设计与实现[D]. 李辉.电子科技大学2011
  • [2].基于语义Web的数字图书馆资源语义描述方法研究[D]. 王洪磊.哈尔滨工程大学2007
  • [3].基于概念格的Web文本聚类过程模型研究[D]. 李海峰.吉林大学2010
  • [4].情境感知的Web信息自适应个性化服务研究[D]. 周莉.浙江理工大学2011
  • [5].基于Web使用挖掘的网站优化策略研究[D]. 程文.郑州大学2012
  • [6].基于Web服务的共建共享型数字图书馆研究[D]. 张爱红.四川大学2005
  • [7].基于Web挖掘技术研究及其在数字图书馆中的应用[D]. 朱秀云.辽宁科技大学2012
  • [8].语义Web技术在信息检索系统中的应用研究[D]. 刘景亮.东北师范大学2010
  • [9].基于Web的图书馆服务质量调研与评价系统研究[D]. 汪景.江苏大学2010
  • [10].语义Web在医学知识组织中的应用研究[D]. 李萍萍.中国人民解放军军事医学科学院2010

相关论文

  • [1].图书馆网络信息资源保存的风险管理[D]. 于明佳.华南师范大学2007
  • [2].网络信息资源保存制度探析[D]. 郝明.黑龙江大学2007
  • [3].网络环境下学术信息的开放存取研究[D]. 孙语择.吉林大学2007
  • [4].数字迁移研究[D]. 洪娜.郑州大学2007
  • [5].数字图书馆信息资源建设研究[D]. 胡渊.陕西师范大学2006
  • [6].数字信息的长期保存[D]. 宋显彪.四川大学2005
  • [7].我国数字档案馆建设的现状分析与发展研究[D]. 宋艳萍.武汉大学2005
  • [8].网络信息资源保存问题研究[D]. 刘亮.北京邮电大学2006
  • [9].电子文件的长期保存研究[D]. 颜晓栋.武汉大学2004
  • [10].馆藏资源数字化方法研究[D]. 张艳红.武汉大学2004

标签:;  ;  ;  ;  ;  

Web资源采集与保存研究
下载Doc文档

猜你喜欢