面向智能服务的Web内容计算研究与应用

面向智能服务的Web内容计算研究与应用

论文摘要

WEB是人们获取信息与知识的重要途径,它的海量性、多样性、动态性和半结构化等特性增加了其信息进行自动处理的难度,也吸引了研究者的兴趣。如何从大量的信息中发现用户感兴趣的信息是目前因特网信息搜索研究的课题;如何将WEB上丰富的信息转化为有用的知识是WEB挖掘和WEB知识发现的任务;如何使用户获取个性化信息,从而使WEB提供更多的服务功能是WEB智能需要解决的问题。目前WEB信息数据大致可以分为三类:内容数据(Content Data)、访问数据(Usage Data)和结构数据(Structure Data),因此也形成WEB研究的三个大的方向:WEB内容挖掘、WEB访问挖掘和WEB结构挖掘。WEB的信息载体主要是WEB页面,它的内容包含显示的数据、标记和超链接。基于WEB内容的计算就是以WEB页面为对象,研究WEB的信息提取、WEB的信息检索和WEB智能服务等涉及到的问题。本文在综合了WEB内容计算的研究基础上,重点研究并取得如下创新性成果: (1) 提出了一种增量式挖掘方法iFP-Growth,使传统的FP-Growth方法适应于Web动态数据环境的关联规则挖掘。 Web页面数据的半结构化、不规则性和动态更新等特征,使得基于Web内容的数据挖掘研究具有一定的复杂性。本文总结了多种从Web页面中提取半结构化数据的理论与方法,针对Web内容数据的特点,提出的增量式挖掘方法iFP-Growth,使传统的FP-Growth方法适应于动态数据环境的关联规则挖掘。并以中国汽车市场网为例,挖掘消费者对不同类别、不同型号、不同价格轿车的购买偏好。 (2) 提出一种基于句子相关度的文本自动分类模型TCSC) 针对中文WEB文档集的分类和聚类等WEB信息检索(IR)课题中需要进行中文分词和词的多义性问题,利用语料库,提出了一种基于句子的文本特征选择,利用训练文本自动生成类别语料库,根据句内词元的类别相关性和句子位置信息,给出了基于句子类别相关度矩阵的文本分类方法,从而在分类阶段避免了分词处理,同时该方法对于词的多义性具有不敏感性。

论文目录

  • 摘要
  • Abstract
  • 第一章 综述
  • 1.1 Web内容计算和挖掘
  • 1.2 Web内容挖掘
  • 1.2.1 Web信息提取
  • 1.2.2 Web数据挖掘
  • 1.2.3 Web信息检索
  • 1.2.4 Web文本挖掘
  • 1.2.4.1 Web文本采集与预处理
  • 1.2.4.2 文本的表示模型
  • 1.2.4.3 文本的特征选择
  • 1.2.4.4 文本分类方法与评价
  • 1.2.5 Web内容挖掘的主要方法
  • 1.3 Web结构挖掘
  • 1.4 Web使用挖掘
  • 1.5 智能Web服务
  • 1.6 语义Web与内容计算
  • 1.7 本文工作内容
  • 1.8 本论文内容安排
  • 参考文献
  • 第二章 基于Web信息提取的增量数据挖掘
  • 2.1 引言
  • 2.2 Web信息提取研究的发展
  • 2.3 Web信息提取的概念
  • 2.4 Web信息提取模型
  • 2.5 Web信息提取常用方法
  • 2.5.1 Web信息的主要组织方式
  • 2.5.2 Web信息提取的方法
  • 2.6 Web提取信息的特点与挖掘
  • 2.7 基于Web信息提取的增量式挖掘与应用
  • 2.7.1 从Web页面中提取半结构化的数据
  • 2.7.2 增量FP-Growth算法挖掘关联规则
  • 2.7.3 实例应用
  • 2.8 结语
  • 参考文献
  • 第三章 基于句子相关度的Web文档分类
  • 3.1 概述
  • 3.2 Web文本挖掘简介
  • 3.3.1 Web文本采集与预处理
  • 3.3.2 文本的特征表示
  • 3.4 基于句子相关度的分类方法研究
  • 3.4.1 类别语料库
  • 3.4.2 句子相关度分类算法
  • 3.4.3 句子的类别相关度
  • 3.4.4 分类处理
  • 3.4.5 实验与结果分析
  • 3.5 结语
  • 参考文献
  • 第四章 基于Web内容的智能服务
  • 4.1 引言
  • 4.2 智能Web服务
  • 4.2.1 智能Web服务的定义
  • 4.2.2 智能Web服务的框架
  • 4.2.3 智能Web服务的研究
  • 4.2.4 智能Web服务的应用
  • 4.3 一个智能Web比较网站的研究与实现
  • 4.3.1 比较网站的结构
  • 4.3.2 比较网站的关键技术
  • 4.3.3 数据分析与结果发布
  • 4.3.4 实验结果和讨论
  • 4.4 结语
  • 参考文献
  • 第五章 WEB内容计算的希望—语义WEB(Semantic Web)
  • 5.1 语义Web定义和体系结构
  • 5.2 语义Web的几个关键技术
  • 5.2.1 XML和XML schema
  • 5.2.2 RDF--Web数据的语义描述模型
  • 5.2.2.1 RDF概念
  • 5.2.2.2 RDF数据模型
  • 5.2.3 Ontology(本体)
  • 5.2.3.1 什么是Ontology
  • 5.2.3.2 Ontology研究的意义
  • 5.2.3.3 Ontology当前研究状况
  • 5.3 Semantic Web在信息获取和内容计算中的应用
  • 5.4 结语
  • 参考文献
  • 第六章 总结和未来工作
  • 6.1 本文工作总结
  • 6.2 未来工作
  • 攻读博士学位期间参与的科研项目及主要成果
  • 致谢
  • 相关论文文献

    • [1].构建智慧图书馆智能服务系统[J]. 办公自动化 2017(24)
    • [2].“乐活校园”智能服务应用设计与实现[J]. 电脑编程技巧与维护 2018(06)
    • [3].可穿戴设备在图书馆智能服务中的应用[J]. 内蒙古科技与经济 2016(22)
    • [4].德国智能服务世界[J]. 中国工业评论 2016(05)
    • [5].信息化背景下高校图书馆智能服务模式的构建研究[J]. 无线互联科技 2019(22)
    • [6].基于人工智能的智能服务机器人在政务服务领域的设计与应用[J]. 网络安全技术与应用 2020(03)
    • [7].工行首推智能服务[J]. 金融科技时代 2013(07)
    • [8].智能服务时代图书馆劳动关系转型研究[J]. 河南图书馆学刊 2020(03)
    • [9].智能服务机器人引领智慧变革[J]. 高科技与产业化 2016(05)
    • [10].高校图书馆个性化智能服务中的隐私保护[J]. 图书馆学刊 2013(12)
    • [11].构建以患者为中心的医院智能服务平台[J]. 医疗卫生装备 2011(02)
    • [12].智能服务的概念内涵及实现路径[J]. 管理现代化 2019(04)
    • [13].关于智能服务系统中产品设计的探究[J]. 产业科技创新 2020(04)
    • [14].人机物互联的智能服务系统架构研究[J]. 无线电工程 2017(11)
    • [15].数字[J]. 老同志之友 2017(21)
    • [16].浅析政府网站智能服务应用[J]. 新闻前哨 2018(07)
    • [17].2019年7-8月主题:智能服务慧生活[J]. 快乐语文 2019(14)
    • [18].企业级移动互联微信信智能服务平台设计实现研究[J]. 网络安全技术与应用 2014(07)
    • [19].力克Vector销量达千台[J]. 纺织服装周刊 2011(03)
    • [20].智能服务系统下的远程开放教育非学术支持服务模式研究[J]. 湖北开放职业学院学报 2019(18)
    • [21].信息化背景下高校图书馆智能服务模式的构建探索[J]. 科技风 2019(33)
    • [22].商业银行网点转型与智能服务模式效率提升研究[J]. 农村金融研究 2018(05)
    • [23].大数据背景下智能服务在传统服装业的应用与发展研究[J]. 现代商贸工业 2019(15)
    • [24].楼宇卫士智能服务监测机器人[J]. 物联网技术 2019(04)
    • [25].基于多感官交互的公共智能服务亭设计研究[J]. 包装与设计 2018(05)
    • [26].三一搅拌站智能服务系统让违规用油无所遁形[J]. 工程机械 2012(09)
    • [27].智慧城市信息智能服务模式的构建[J]. 山西建筑 2020(07)
    • [28].智能服务:创新是关键词[J]. 通讯世界 2012(04)
    • [29].论军民深度融合的通导遥一体化空天信息实时智能服务系统[J]. 网信军民融合 2018(12)
    • [30].高校图书馆个性化智能服务中的隐私保护[J]. 图书馆学刊 2009(10)

    标签:;  ;  ;  ;  ;  

    面向智能服务的Web内容计算研究与应用
    下载Doc文档

    猜你喜欢