Web数据挖掘在个性化搜索技术上的研究

Web数据挖掘在个性化搜索技术上的研究

论文摘要

互联网是为用户提供信息交换、共享而发展起来的Internet应用。人们上网的主要目的是查询信息。由于Internet上的信息具有数量庞大、无序性强、重复性大的特点,互联网上的各种信息检索系统----搜索引擎成为帮助人们上网获取信息的主要工具。这些搜索引擎在给人们带来很大便利的同时也暴露出许多问题。搜索引擎返回给用户的检索结果数量越来越大,人们越来越难以找到真正符合自己意图的信息。传统搜索引擎缺乏个性化的局限性日益突出,单单依靠传统搜索引擎己经无法满足人们的需求,因此,搜索引擎的个性化研究成为当今Internet信息检索方面的一个重要课题。本文首先对Web挖掘的理论基础及个性化搜索引擎进行了介绍,其中包括Web数据挖掘分类、Web数据挖掘在个性化搜索中的应用、搜索引擎的分类及检索效果主要性能指标、个性化搜索引擎的基本类型和涉及的主要技术等。其次,针对Google给出的PageRank排序算法的一个缺陷,即同一页面的所有链出页面分得该页面相同权重的PageRank值,研究了给出的具有针对性的新算法,即使得同一页面的链出页面根据自身页面的重要性分得该页面不同权重的PageRank值。再次,本文探讨了用户兴趣模型,包括用户兴趣建模常用方法、用户兴趣模型技术等。最后,设计了个性化搜索引擎模型,思想是将Web挖掘和PageRank技术结合起来,建立用户兴趣模型,引入到个性化搜索引擎中,使检索结果更加符合用户的实际需要。在论文的最后,总结了本文的研究工作与存在的不足,并对进一步的研究工作进行了分析和展望。

论文目录

  • 摘要
  • ABSTRACT
  • 绪论
  • 1 课题研究背景
  • 2 国内外研究现状
  • 3 本文主要研究内容
  • 4 全文组织结构
  • 第一章 Web 理论基础
  • 1.1 数据挖掘简介
  • 1.2 Web 数据挖掘的分类
  • 1.2.1 Web 内容挖掘
  • 1.2.2 Web 结构挖掘
  • 1.2.3 Web 日志挖掘
  • 1.3 Internet 个性化服务
  • 1.4 Web 数据挖掘在个性化搜索中的应用
  • 本章小结
  • 第二章 个性化搜索引擎
  • 2.1 搜索引擎介绍
  • 2.1.1 搜索引擎分类
  • 2.1.2 搜索引擎检索效果主要性能指标
  • 2.2 个性化搜索引擎的基本类型
  • 2.2.1 基于个性信息采集的个性化搜索引擎
  • 2.2.2 基于查询改进的个性搜索引擎
  • 2.2.3 基于个性化网页权重的个性化搜索引擎
  • 2.3 个性化搜索引擎涉及的主要技术
  • 2.3.1 Web 数据挖掘
  • 2.3.2 用户兴趣模型
  • 2.3.3 聚类技术
  • 2.3.4 信息过滤技术
  • 本章小结
  • 第三章 PageRank 算法
  • 3.1 传统 PageRank 算法简介
  • 3.2 影响 PageRank 值的因素
  • 3.2.1 内部链接对PageRank 值的影响
  • 3.2.2 入站链接对PageRank 值的影响
  • 3.2.3 出站链接对PageRank 值的影响
  • 3.3 PageRank 新算法
  • 3.3.1 传统PageRank 算法缺陷
  • 3.3.2 算法改进思想
  • 3.3.3 初步实验结论
  • 3.3.4 实验验证
  • 本章小结
  • 第四章 用户兴趣模型
  • 4.1 用户模型信息的获取方法
  • 4.2 用户兴趣建模常用方法
  • 4.2.1 基于评价的表示
  • 4.2.2 基于内容的表示
  • 4.2.3 基于知识模型的表示
  • 4.3 用户建模技术
  • 本章小结
  • 第五章 基于Web 数据挖掘的个性化搜索引擎模型设计
  • 5.1 搜索引擎的影响因素
  • 5.2 个性化搜索引擎模型设计
  • 5.2.1 设计思想
  • 5.2.2 个性化搜索引擎模型结构设计
  • 5.3 个性化搜索引擎分析
  • 5.3.1 模型构建流程
  • 5.3.2 模型结构分析
  • 本章小结
  • 结论与展望
  • 参考文献
  • 攻读硕士学位期间发表的学术论文
  • 致谢
  • 相关论文文献

    • [1].中小银行数据挖掘思路浅析[J]. 金融电子化 2020(05)
    • [2].浅析大数据挖掘中抽样估计法的应用[J]. 现代信息科技 2019(21)
    • [3].基于大数据挖掘的广播电视客户价值分析[J]. 科技视界 2019(34)
    • [4].基于深度学习的工业领域数据挖掘方法及应用[J]. 数字技术与应用 2019(11)
    • [5].基于大数据思维的财务数据挖掘及应用研究[J]. 国际商务财会 2019(11)
    • [6].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(04)
    • [7].基于云计算的大数据挖掘体系构建分析[J]. 中外企业家 2020(11)
    • [8].测绘地理信息专业背景下的《时空数据挖掘》课程设计[J]. 南宁师范大学学报(自然科学版) 2020(01)
    • [9].智慧医疗下云数据挖掘在精细化医疗管理中的应用[J]. 中医药管理杂志 2020(03)
    • [10].高校管理人员教育数据挖掘能力培养的实践价值与实施路径[J]. 中国教育信息化 2020(07)
    • [11].大数据环境下的数据挖掘课程教学探索[J]. 中国新通信 2020(06)
    • [12].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(05)
    • [13].基于云计算的大数据挖掘内涵及解决方案研究[J]. 数字通信世界 2020(03)
    • [14].基于可拓数据挖掘的建筑立面设计方法研究[J]. 科技传播 2020(08)
    • [15].数据挖掘实践教学环节探索[J]. 科技经济导刊 2020(11)
    • [16].大数据挖掘与云服务模式的构建[J]. 江西电力职业技术学院学报 2020(01)
    • [17].医疗云存储下医院信息数据挖掘及实现技术的探索[J]. 信息与电脑(理论版) 2020(05)
    • [18].高校治理视阈下教育数据挖掘的应用与挑战[J]. 高教论坛 2020(04)
    • [19].大数据挖掘与分析的关键技术研究[J]. 中国新通信 2020(08)
    • [20].浅析数据挖掘[J]. 内江科技 2020(06)
    • [21].教育数据挖掘关键技术应用研究[J]. 轻纺工业与技术 2020(06)
    • [22].物联网海上舰船航行数据挖掘方法[J]. 舰船科学技术 2020(12)
    • [23].云环境中大数据挖掘的有效花费研究[J]. 上海理工大学学报 2020(03)
    • [24].对《零售数据挖掘与应用》课程教学的思考[J]. 知识经济 2020(18)
    • [25].教育数据挖掘和学习分析研究进展[J]. 牡丹江师范学院学报(自然科学版) 2020(03)
    • [26].第16届高级数据挖掘和应用国际会议[J]. 软件工程 2020(08)
    • [27].电商市场中大数据挖掘的分析以及决策探究[J]. 中国新通信 2020(12)
    • [28].关于大数据挖掘中的数据分类算法技术的研究[J]. 电脑知识与技术 2020(20)
    • [29].长输油气管道大数据挖掘与应用[J]. 物联网学报 2020(03)
    • [30].数据挖掘实践课程教学模式的探索[J]. 教育教学论坛 2020(36)

    标签:;  ;  ;  ;  

    Web数据挖掘在个性化搜索技术上的研究
    下载Doc文档

    猜你喜欢