论文摘要
Internet的发展使得Web网页开发也获得了很大的发展。当网络技术和分布式计算技术逐渐发展并走向成熟时,Web网页开发也变得非常复杂。Internet带来的最直接问题是Web网页的不断增加。由于缺乏统一有效的管理,大多数网页的开发、维护工作还处于混乱状态。当前Web网页一般采取小粒度的组件开发方法,使得网页开发带有很大的随意性,并导致网页难以维护。对特定领域的网页开发来说,如果能复用已有的设计和开发成果,将会在很大程度上提高网页的开发效率,节省大量的人力和物力资源。为了满足日渐复杂的商务逻辑,传统的软件编程思想也应用到了Web网页的开发过程中。本研究将组件技术引入到Web网页开发过程中,希望从大粒度的框架设计复用和小粒度的组件复用两方面来改善网页的开发过程。本文首先对现有的Web开发方法和XML技术加以研究,结合软件复用技术,提出了适合XML结构又较为通用的树型结构抽取复用的Web开发方法,它能够把Web页面的结构标记抽取出来并在此基础上形成一个XML组件。该组件可以复用到以后的网页结构中。
论文目录
摘要Abstract第一章 前言1.1 问题的提出1.2 研究背景及研究现状1.3 本文的内容和主要工作第二章软件复用及XML相关技术2.1 软件复用技术2.1.1 组件2.1.2 框架2.2 Web 表现层技术2.2.1 Web 表现层开发技术现状2.2.2 表现层框架开发技术的概况2.3 HTTP 技术2.3.1 HTTP 协议的运作方式2.3.2 HTTP HEADER2.4 HTML 语言局限性2.4.1 HTML 与WEB 网页2.4.2 HTML 的局限性2.4.3 格式良好的HTML 文档2.5 XML 相关技术2.5.1 XML 的起源和发展2.5.2 XML 的特点2.5.3 XML 的结构特征和模式2.5.4 XML 技术在本文中的应用第三章 基于XML 网页结构复用系统框架模型3.1 系统框架设计目标3.2 系统框架总体结构3.2.1 Enhydra 及其核心技术XMLC3.2.2 文档对象模型(DOM)3.2.3 XMLC 中的DOM3.2.4 XMLC 在网页结构复用中的优势3.3 系统框架组成模块3.3.1 页面预处理模块3.3.2 结构抽取模块3.3.3 XMLC 编译器3.3.4 组件集成模块3.3.5 系统表现层子框架第四章 网页结构抽取过程设计与实现4.1 网页结构抽取过程设计4.2 网页获取4.2.1 目标网页的指定方式(POST/GET)4.2.2 网站连接登录问题4.2.3 HTML 源代码获取4.3 抽取规则定义4.3.1 网页模式提取4.3.2 目标模板模式的建立4.3.3 DOM 节点抽取过程描述文件4.4 结构抽取实施4.4.1 获取网页数据4.4.2 HTML 到XML 的转换4.4.3 DOM 树的建立和打印4.4.4 目标模板的建立4.4.5 映射规则执行4.4.6 抽取规则执行算法4.4.7 将DOM 文档转换为XML 文件4.5 本章小结结论与展望参考文献致谢附录(攻读学位期间所发表的学术论文)详细摘要
相关论文文献
标签:开发论文; 结构抽取论文; 复用论文;