论文摘要
随着互联网应用的日渐多样化,在实际的互联网应用中,存在着大量对名人、明星、罪犯、热门图像等特定人脸图像的搜索需求。传统的文本检索具有检索方式单一的局限性以及检索精度易受关键字欺骗等不足,而通用的图像搜索难以满足特定领域的精度需求以及检索易受到背景图像的干扰,因此这两种方法都无法满足互联网上人脸图像的检索需求,需要采用文本信息、图像内容以及特定领域相关知识相结合的方式达到更丰富的查询方式和更精确的检索性能。基于互联网的可扩展的垂直图像检索框架是一种综合利用文本信息、图像内容以及特定领域相关知识的框架,通过引入特定领域中文分词、网页相关性分析、非特定领域图像过滤等关键技术,能过滤掉不相关图像以及去除图像中背景区域的干扰,通过采用更精准的特征向量表征图像,实现了更精确的检索性能。基于互联网的人脸图像检索系统主要在此基础上引入非人脸图像过滤,以及人脸特征提取和匹配,实现基于互联网的人脸图像检索。非人脸图像过滤模块能在系统的数据收集过程中过滤掉不相关的网页以及不包含人脸的图像。在页面抓取阶段利用网页相关性分析直接跳过不相关网页,减少数据下载量以提高网页下载质量,对入库图像利用AdaBoost Cascade算法过滤不含有人脸的图像并提取人脸区域,排除背景区域干扰,提高了系统检索性能。特征提取模块针对提取的人脸区域引入LGBP算法,通过性能均衡测试选取合适参数提取特征向量,并采用直方图相交算法进行匹配,在保证检索精度的同时减少了匹配时间。同时对该算法进行扩充,提出了基于空间金字塔模型的PLGBP算法,该方法以牺牲匹配时间为代价提高了检索精确度。此外,基于互联网的人脸图像检索系统还用到了中文分词、倒排索引、以及相关反馈等技术。系统综合利用文本语义信息,图像视觉特征以及人脸领域相关算法,从抓取的100多万页面中解析并得到220913张人脸数据,在关键字与图像的融合检索性能测试中取得70%的平均查准率,响应时间在7S以内。