论文摘要
三维模型数量在最近10年间呈现出几何级增长的态势,而互联网的急速发展和广泛普及又方便了多媒体信息之间的交流,因此研究三维模型检索的理论与技术,开发高效率的三维模型检索系统势在必行。三维模型检索的核心问题之一是“特征提取”。但是与图像检索相比,三维模型的空间组织结构比较复杂,很难找到合适的特征对其进行描述,其结果是目前已提出的特征也很难满足实际检索的需要,同时也没有非常成熟的三维模型检索系统可以提供。以是否需要旋转规一化预处理为标准,三维模型特征可分为旋转相关特征与旋转无关特征。从目前的研究情况看来,前者总的检索性能略优于后者,然而对于某些规则性较差的模型,旋转规一化很容易失败,在这种情况下后者反而更有优势。在国家自然科学基金项目《基于球面小波的三维模型检索技术研究》(60573146)的支持下,本文对这两种特征都进行了深入的研究和探索。首先分析了三维模型两种预处理过程(旋转规一化和各向同性化),并在旋转规一化的基础上提出了深度图像和区域熵两种旋转相关特征,分别应用于不同类别的三维模型,提升了相应的三维模型检索性能。另外,为了克服旋转相关特征严重依赖旋转规一化的缺点,提出了一种基于球面图像的旋转无关特征。根据上述研究工作,开发了一套具有初步实用价值的三维模型检索系统。本文的研究成果和主要贡献可以概括为如下四点:1.提高了旋转规一化的稳定性,简化了各向同性化的进程。首先重点探索了提高旋转规一化工具-PCA稳定性的途径。从PCA的基本原理出发,分析了三种可能的失败情况,并针对每种情况提出了相应的解决方案,减少了旋转规一化失败率,并尽可能消除了失败带来的负面影响。另外,鉴于各向同性化预处理可以用来提高特征的检索性能,也对其进行了深入的分析。着重论证了各向同性化与PCA之间的本质联系,据此提出了利用PCA矩阵进行各向同性化的思想,并在实现中采用了一种基于迭代策略的各向同性化方法,使三维模型表面达到充分同性化。2.提出了一种基于深度图像的特征提取算法,在检索效率与时间消耗上找到了一个比较合理的平衡点。将三维模型沿PCA坐标面切分,各部分投影到对应的立方体包围盒平面上形成六个深度图像。对深度图像采用联合使用不变矩和极坐标傅立叶变换提取其特征,然后通过对三维模型的协方差特征值进行分析,赋予X ? Y面、Y ? Z面和Z ?X面投影不同的权值以组成整个三维模型的特征。实验显示该特征可以得到与光场法相差无几的检索性能,但时间消耗却远低于光场法。对于较为规则的三维模型来说,此特征描述符效果较好。3.对由散乱三角面片组成的三维模型采用体素化的策略使其以规则信号表示,为诸多经典信号分析工具得以应用提供了一个有利的平台。使用了一种基于位操作的立方体与空间三角形相交快速判断算法,极大地提高了二值体素化的速度。为了更加精确地表示三维模型,提出了“灰度体素化”的概念,即将包含在体素内的三维模型表面积映射为该体素的灰度值,并研究了灰度体素化在体可视化中的作用。根据灰度体素化的结果,进一步提出了一种基于区域熵的特征提取算法,即将体素化模型分为若干区域并计算各区域的熵值,再把这些熵值以特定的方式组合起来形成原始三维模型的特征。实验显示该特征具有良好的区分性和聚类性,可以用于较为复杂三维模型的检索。4.提出了一种基于球面图像的特征提取算法,作为旋转无关特征,它并不需要事先进行PCA处理,因此非常适合检索旋转规一化可能失败的三维模型。首先将正二十面体映射到球面上形成球面网格,并对球面网格进行若干次1-4剖分,形成球面像素格式;然后将球面与体素化模型求交,得到若干不同半径的同球面图像;再对这些球面图像进行蝶形小波分析,将其分解并降阶,把最终得到的20个小波系数作为该图像的特征;最后将所有球面图像的系数组合起来形成三维模型的特征。实验显示这种特征的检索性能比同样旋转无关的形状分布法及形状直方图法有了明显的提高。另外,为了解决因维数过高而导致的检索速度慢的问题,使用了一种基于超球集合的特征库组织结构,快速排除了明显不相似的三维模型,极大地提高了检索的速度。三维模型检索是目前计算机图形学研究的热点方向之一,本文围绕“特征提取”展开了四个方面的具体研究:深入分析了预处理过程,并提出了三种特征描述符,以满足不同检索的需要。它们的内容各自独立成章,又相互关联,并层层深入,基于本文算法开发的三维模型检索系统实现了上述理论,并取得了较好的效果。最后本文给出结论,并提出了进一步的研究设想。