论文摘要
继传统互联网快速发展的搜索技术为用户广泛接受之后,移动互联网搜索以其更大的便捷性成为人们关注的热点,利用移动终端搜寻信息将是未来的发展趋势。移动终端的存储容量、网络带宽、页面处理速度,屏幕大小和电池使用寿命影响用户体验效果。目前,网络带宽在不断改善,存储容量,页面处理速度和电池寿命的限制将会随着硬件技术的发展而得到解决,唯有屏幕尺寸大小难以改变,但这个问题直接影响用户的使用效果,因此改进移动终端Web页面显示势在必行。本文对移动终端页面显示技术的不足进行研究,设计了一种移动终端网页个性化显示优化系统。首先,介绍了移动终端页面显示的相关理论,为进一步的研究奠定理论基础,接着介绍了目前与移动终端页面显示相关的技术,分别是Web页面结构提取技术、Web页面内容提取技术以及移动终端的页面布局方式,为个性化显示优化系统的设计做铺垫。其次,根据个性化页面显示策略,设计了个性化显示优化系统的总体框架和工作流程,提出基于RBF分块重要度学习的页面显示算法和基于预测内容的文本提取算法。基于RBF分块重要度学习的页面显示算法中,针对“不同用户页面显示不同内容”的需求,使用RBF神经网络学习算法,在分块重要度模型中加入用户的兴趣因素来确定页面的显示内容,缩短用户搜索信息的时间。在基于预测内容的文本提取算法中,考虑到语义内容的完整性,根据标记率提取算法的思想,通过标记率的变化趋势预测“跳点”,以识别页面中的文本内容。然后根据页面内容分布的特点,提出SK-Means聚类算法,该算法能有效地将内容和非内容信息分开,提高了文本内容提取准确率。最后,将个性化显示优化系统部署到Windows Mobile5.0模拟器上,并对系统的性能进行评测,验证系统的可用性。本论文的研究内容是国家科技部“新型网络终端操作系统社区版本研究与开发”的重要组成部分,具有重要的理论和现实意义。
论文目录
摘要ABSTRACT第一章 绪论1.1 引言1.2 课题背景1.3 课题研究内容1.4 论文组织结构第二章 相关研究2.1 Web页面信息提取相关研究2.1.1 Web页面结构提取技术研究现状2.1.1.1 基于用户视觉特征的页面结构提取技术2.1.1.2 基于页面布局信息的结构提取技术2.1.2 Web页面内容提取技术研究现状2.1.2.1 基于统计理论的方法2.1.2.2 基于DOM结构的提取技术2.2 移动终端页面布局方式2.3 移动终端Web页面显示技术研究现状2.4 本章小结第三章 个性化显示优化系统的基本架构3.1 个性化显示优化系统的结构3.1.1 用户信息采集模块3.1.2 预处理模块3.1.3 页面分割模块3.1.4 分块重要度学习模块3.2 个性化显示优化系统工作流程3.3 个性化显示优化系统特点3.4 本章小结第四章 基于预测内容的文本提取算法4.1 文本提取必要性分析4.2 基于标记率的内容提取算法分析4.3 基于预测内容的文本提取算法设计4.3.1 基于预测内容的文本提取算法4.3.2 SK-Means聚类算法设计4.4 实验及结果分析4.4.1 测试指标4.4.2 实验方法4.4.3 实验结果分析4.5 本章小结第五章 基于RBF分块重要度学习的页面显示算法5.1 基于用户学习的页面显示策略5.2 用户兴趣库的建立5.3 分块重要度模型5.3.1 页面语义块分割5.3.2 计算语义块的空间特征值5.3.3 计算语义块的内容特征值5.3.4 计算语义块文本特征值5.4 RBF分块重要度学习算法5.4.1 RBF神经网络模型5.4.2 RBF 神经网络学习算法5.4.3 RBF语义块重要度学习实验流程5.5 本章小结第六章 实现与测试6.1 个性化显示优化系统原型系统实现6.1.1 个性化显示优化系统的实现平台简介6.1.2 个性化显示优化系统的系统原型6.1.3 个性化显示优化系统各功能模块实现6.1.3.1 用户信息采集模块6.1.3.2 预处理模块6.1.3.3 页面分割模块6.1.3.4 分块重要度学习模块6.2 实验与评测6.2.1 测试环境6.2.2 评价指标6.2.3 测试方法和结果分析6.2.3.1 可用性测试方法6.2.3.2 测试结果分析6.2.3.3 性能评估方法6.2.3.4 测试结果分析6.3 本章小结第七章 总结与展望7.1 工作总结7.2 工作展望致谢参考文献作者在学期间取得的学术成果
相关论文文献
标签:个性化论文; 显示优化论文; 文本提取论文;