基于大规模社交媒体挖掘的景点识别

基于大规模社交媒体挖掘的景点识别

论文摘要

近年来随着社交网站的兴起和数字摄影设备的普及,社交旅游系统异军突起。不同于传统旅游系统,它们的景点图片来源于社交网络,比如Flickr和Panoramio。社交网站的图片(社交媒体)一般携带丰富的上下文信息,包括文本标签、GPS、时间和相机参数。这些信息被应用于景点的自动识别算法中。虽然社交网络共享的景点图片易于获取,然而自动从海量的社交媒体中得到准确的景点图片集合并非易事。首先是图片检索的准确率较低。其次,构建一个世界级的景点识别,浏览算法的高消耗问题,目前大规模媒体计算还无法解决。本文研究了大规模社交媒体挖掘的若干算法,并应用于景点识别和社交旅游系统的开发中。基于大规模社交媒体挖掘,算法能自动地基于社交网站内容识别景点,并可视化。从而构建一个世界级别的景点图片数据库。首先从文本类社交网络Wikitravel提取出1000个景点的信息,并通过地理信息数据库,匹配景点的GPS。其次,开发了一个海量图片检索的框架。框架首先是基于GPS的图片检索,并从返回结果所携带的文本标签集提取了5000个文本主题。框架其次是执行基于文本主题关键字的图片检索。共检索了约800万张的图片。本文接着对数据库的语义断层,文本标签和GPS噪声情况进行了分析,分析结果作为开发图片GPS标注方法和相机姿态估计算法的现实依据。基于获得的GPS噪声情况对图片数据库进行地理标注和地理信息矫正,从而得到精确描述景点地理内容的约500万张级别的可视化数据集。通过单一景点内图像多特征聚类,得到每个景点图片聚类结果,并用高效的词汇树索引图像的SIFT特征。每个类中,用8点算法估计出相机姿态,根据图片的二维经纬度向量,配准到Google Maps上。从而提供景点多视角浏览功能。由于词汇树的高效性,在应用系统中可以快速返回指定视角的图片。本文用数据可视化算法和用户评估方式对算法进行了评估。算法估计出的相机姿态,从ECEF参考的可视化的结果来看,基本还原了图片拍摄的位置和角度。用户评估表明,算法的准确率和查全率满足用户需求。

论文目录

  • 摘要
  • Abstract
  • 第一章 绪论
  • 1.1. 研究背景和意义
  • 1.2. 国内外研究现状
  • 1.2.1. 国内研究现状
  • 1.2.2. 国外研究现状
  • 1.3. 论文的结构
  • 第二章 社交媒体介绍
  • 2.1. 协作性群编辑共享信息黄页社区
  • 2.1.1. 维基百科Wikipedia
  • 2.1.2 在线旅游指南Wikitravel
  • 2.2. 图片共享社区
  • 2.2.1. 全球最大的图片共享社区Flickr
  • 2.2.2 地理标签图片共享社区Panoramio
  • 2.2.3. Picasa 网络相册
  • 2.2.4. 三大社区分析比较
  • 2.3. 本章小结
  • 第三章 典型景点浏览系统介绍
  • 3.1. 景点浏览
  • 3.1.1. 基于在线地图服务
  • 3.1.2. 基于全景摄像
  • 3.1.3. 基于社交媒体
  • 3.1.4. 分析与比较
  • 3.2. 本章小结
  • 第四章 世界级景点图片数据库
  • 4.1. 景点信息提取
  • 4.1.1. 景点地理编码
  • 4.2. 景点图片检索
  • 4.2.1. 基于地理位置
  • 4.2.2. 概念提取
  • 4.2.3. 基于关键字的图片检索
  • 4.3. 数据集分析
  • 4.3.1. 语义鸿沟
  • 4.3.2. 文本标签噪声
  • 4.3.3. 地理标签噪声
  • 4.4. 本章小结
  • 第五章 地理标签自动标注与校准
  • 5.1. 自动标注方法
  • 5.1.1. 基于文本标签的地点建模方法
  • 5.1.2. 视觉定位方法
  • 5.1.3 多特征聚类方法
  • 5.1.4 小范围内视觉定位方法
  • 5.2. 自动校正方法
  • 5.3. 本章小结
  • 第六章 多视角浏览算法
  • 6.1. 景点多视角浏览
  • 6.2. 双目视觉
  • 6.3. 算法描述
  • 6.3.1. SIFT-Flow 图像匹配方法
  • 6.3.2. RANSAC 增强的8 点算法
  • 6.3.3. 视角地理配准方法
  • 6.4. 算法评估
  • 6.4.1. 可视化分析
  • 6.4.2. 用户评估
  • 6.5. 本章小结
  • 总结与展望
  • 总结
  • 展望
  • 参考文献
  • 攻读硕士学位期间取得的研究成果
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  

    基于大规模社交媒体挖掘的景点识别
    下载Doc文档

    猜你喜欢