英文短文本相似性研究及在图书推荐中的应用

英文短文本相似性研究及在图书推荐中的应用

论文摘要

随着互联网的飞速发展,顾客和商家对电子商务推荐系统的需求日益强烈。然而当前的电子商务推荐系统大多是采用以用户为基础进行构建的。同时,由于系统建立之初,顾客对系统的访问量较少,这些系统往往遭遇了“冷启动”的问题,不能有效发挥推荐系统应有的作用。而基于内容的推荐系统以商品自身属性为出发点,不依靠顾客行为,可以有效解决这一问题。基于内容的推荐系统通常以文本相似性研究为基础,但是由于在推荐中涉及的往往是短文本的相似性问题,而长文本的推荐算法不能很好的应用于短文本相似性比较。本文以计算机图书推荐为例,提出一种实现短文本相似性比较的方法。该方法从互联网中获取了计算机图书的语料库,通过分词、去停止词等预处理,按照基于规则和基于统计的方法提取了计算机领域术语,并进行实验验证。之后,基于提取的计算机领域术语构建了计算机领域语的层次结构,并结合了短文本语义比较的方法,最终形成计算机图书的推荐。同时,基于提出的理论,结合实际,构建出电子商务推荐系统。该系统充分考虑用户需求,对实际的运行方式进行合理设计,为构建电子商务推荐系统提供了一条新的思路。

论文目录

  • 摘要
  • ABSTRACT
  • 1 引言
  • 1.1 电子商务推荐系统的研究背景
  • 1.2 当前推荐系统存在的问题
  • 1.3 研究的目的和意义
  • 1.4 论文主要研究的内容
  • 2 推荐系统及其相关理论
  • 2.1 推荐系统概述
  • 2.1.1 推荐系统的概念
  • 2.1.2 推荐系统的作用
  • 2.1.3 推荐系统实现的类别
  • 2.1.3.1 基于内容的推荐系统
  • 2.1.3.2 基于聚类技术的推荐系统
  • 2.1.3.3 基于贝叶斯网络的推荐系统
  • 2.1.3.4 基于关联规则的推荐系统
  • 2.1.3.5 基于协同过滤技术的推荐系统
  • 2.1.3.6 基于混合型的推荐系统
  • 2.1.4 推荐系统的系统构成
  • 2.1.5 推荐系统的工作流程
  • 2.2 基于内容推荐系统的关键技术
  • 2.2.1 文本相似性技术
  • 2.2.1.1 自然语言的概念
  • 2.2.1.2 短文本分析技术
  • 2.2.1.3 短文本处理技术的层次
  • 2.2.2 主题词获取技术
  • 2.2.2.1 术语的概念和特点
  • 2.2.2.2 术语获取及方法
  • 2.2.2.3 计算机领域术语获取的必要性
  • 3 计算机类主题词获取技术
  • 3.1 概述
  • 3.2 获取语料库
  • 3.3 分词、去停止词等预处理过程
  • 3.4 根据规则获取术语
  • 3.5 根据统计方法获取术语
  • 3.6 实验分析
  • 4 图书推荐算法研究
  • 4.1 概述
  • 4.2 构建DMOZ树
  • 4.3 处理DMOZ树
  • 4.4 插入图书节点
  • 4.5 图书描述比较
  • 4.6 形成推荐
  • 5 推荐系统设计与实现
  • 5.1 系统总体设计
  • 5.2 数据库设计
  • 5.2.1 数据库概念模型
  • 5.2.2 数据库逻辑模型
  • 5.2.3 数据库物理模型
  • 5.3 离线推荐数据产生系统
  • 5.4 图书网站的设计
  • 5.4.1 系统需求分析
  • 5.4.2 总体架构
  • 5.4.3 数据链接层
  • 5.4.4 业务逻辑层
  • 5.4.5 业务功能模块
  • 5.4.5.1 顾客功能模块
  • 5.4.5.2 员工功能模块
  • 5.4.5.3 图书功能模块
  • 5.4.5.4 角色功能模块
  • 5.4.5.5 订单功能模块
  • 5.4.6 表现层
  • 5.5 系统运行结果
  • 6 结果与讨论
  • 6.1 结果
  • 6.2 讨论
  • 参考文献
  • 个人简介
  • 导师简介
  • 获得成果目录清单
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  

    英文短文本相似性研究及在图书推荐中的应用
    下载Doc文档

    猜你喜欢