论文摘要
近年来随着社交网站的兴起和数字摄影设备的普及,社交旅游系统异军突起。不同于传统旅游系统,它们的景点图片来源于社交网络,比如Flickr和Panoramio。社交网站的图片(社交媒体)一般携带丰富的上下文信息,包括文本标签、GPS、时间和相机参数。这些信息被应用于景点的自动识别算法中。虽然社交网络共享的景点图片易于获取,然而自动从海量的社交媒体中得到准确的景点图片集合并非易事。首先是图片检索的准确率较低。其次,构建一个世界级的景点识别,浏览算法的高消耗问题,目前大规模媒体计算还无法解决。本文研究了大规模社交媒体挖掘的若干算法,并应用于景点识别和社交旅游系统的开发中。基于大规模社交媒体挖掘,算法能自动地基于社交网站内容识别景点,并可视化。从而构建一个世界级别的景点图片数据库。首先从文本类社交网络Wikitravel提取出1000个景点的信息,并通过地理信息数据库,匹配景点的GPS。其次,开发了一个海量图片检索的框架。框架首先是基于GPS的图片检索,并从返回结果所携带的文本标签集提取了5000个文本主题。框架其次是执行基于文本主题关键字的图片检索。共检索了约800万张的图片。本文接着对数据库的语义断层,文本标签和GPS噪声情况进行了分析,分析结果作为开发图片GPS标注方法和相机姿态估计算法的现实依据。基于获得的GPS噪声情况对图片数据库进行地理标注和地理信息矫正,从而得到精确描述景点地理内容的约500万张级别的可视化数据集。通过单一景点内图像多特征聚类,得到每个景点图片聚类结果,并用高效的词汇树索引图像的SIFT特征。每个类中,用8点算法估计出相机姿态,根据图片的二维经纬度向量,配准到Google Maps上。从而提供景点多视角浏览功能。由于词汇树的高效性,在应用系统中可以快速返回指定视角的图片。本文用数据可视化算法和用户评估方式对算法进行了评估。算法估计出的相机姿态,从ECEF参考的可视化的结果来看,基本还原了图片拍摄的位置和角度。用户评估表明,算法的准确率和查全率满足用户需求。