论文摘要
问题的提出体视学(stereology)是由二维结构信息定量推论三维结构信息的一门界于形态学和数学之间的新兴边缘学科。体视学的基本目的是要从组织二维结构定量认识其三维结构,这就需要准确建立二维形态结构与三维形态结构之间的关系。已经证实二维平面细胞形态的一些参数与三维间存在一定的函数关系,因此可以把实际测得的二维平面数据代入体视学公式来推测真实三维组织结构某些特定指标。用体视学原理和方法定量地描述生物组织的形态结构,通常所检测的指标包括分布密度、数密度、体积密度、表面积密度、长度密度和面积密度等。对于体视学公式的获得、统计量的选择多来自基础理论推导。实际组织是不可能无限次切片的,因此,体视学理论方法中尚有一些问题需要解决。比如,如何实验已有的体视学公式?是否可以找到一种新方法来判断形态参数之间的函数或相关关系?在形态学研究应用中如何选择合适的测量参数以及确定合理的样本量?针对这些问题,我们想到建立一个以特例为基础的能够无限次切片的计算机模型,模拟切片过程以判断统计指标和确定函数关系,为体视学理论方法研究提供一个工具和客观实证方法。研究的目的和意义(1)我们设计这个虚拟实验系统是为了提供一个能无限次应用的统计学实验模型来实验证体视学理论和方法。本文所述布局算法可满足简易性和测量结果的易得性,同时输出结果稳定可靠。能够作为今后体视学研究的一个可供选择的模型工具。(2)对于体视学中的理论和方法,通常以数学推导的方法得到,缺乏一个可以反复抽样模拟的计算机虚拟模型,这也影响到体视学理论和方法的发展。我们试图借助计算机作为模拟多次抽样的过程,并对得到的各种体视学参数数据进行分析和数据拟合检验,来实验体视学公式。(3)对于体视学的研究,目前尚无相关客观实证手段。本文将提供一个可供参考的计算机虚拟实验平台。技术路线和方法第一部分基于MC法的布局算法研究1.预期概率分布的产生方法我们采用蒙特卡罗(Monte Carlo,MC)方法模拟随机现象的发生来进行近似计算,以获得所考察体系的详尽信息,其统计误差可通过增加样本数而减少到所希望的程度。2.均匀分布的布局算法在Visual studio环境中应用线性同余法(Linear Congruential Method)生成均匀分布的随机序列(模数,乘子,增量参数)。调用微软基本类库提供的随机函数srand(seed)来实现,并应用时间函数来确保选用不同的种子参数。3.正态分布的布局算法应用反函数法产生任意分布伪随机序列,其原理是基于已有均匀分布的序列,将所需的概率分布的概率分布函数f(x)进行反变换,得到正态分布的概率分布函数f(x)的反函数F(Y),通过F(Y)就可得到概率分布函数为f(x)的随机序列。4.数据分析及布局序列检验用spss 13.0和Originlab origin 7.5对所得数据进行均匀性和独立性检验。我们采用χ2拟合优度检验法对[0,1]区间的随机序列进行了均匀性检验,并用Pearsonχ2检验法检验了区间大小不同的组别间的差异性。独立性检验我们采用自相关系数检验法。我们采用动差法(Method of Movement)检验序列分布的正态性。判断检验偏度系数(coefficient of skewness)和峰度系数(coefficient of kurtosis)与0的相差是否有显著性。用Kolmogorov-Smirnov/Z拟合优度检验来判断所获数据的理论分布情况。第二部分体视学虚拟实验仿真系统设计与实现1.开发环境本软件系统是在Windows 2000 Professional操作系统下,采用IDE为Visual Studio C++ 6.0,部分控件及中间件由互联网上自由软件提供或下载。并应用OpenGL(Open Graphics Library)进行基本几何图元绘制、矩阵操作、几何变换及模拟粒子点、线、面的绘制等。2.后台数据管理数据库系统采用Micorsoft Acess 2003数据库管理系统,并采用ADO(ActiveX Data Objects)技术作为数据库访问方法。3.人机交互接口依据生物组织切片的基本过程和体视学研究的基本思路及实际需求,通过相应的参数定制相应的模型,然后通过各种外部命令来控制系统的运行,如对用户输入、有效性检验等的控制等。本系统的人机交互接口通过以下各个方面的控制参数来实现:模型参数:粒子数、粒子半径、坐标系长度、试验次数参数等;粒子布局参数:均值和标准差、极差、步长、概率参数等;截面参数:斜率、截面最大径、截面面积、截面周长参数等。计算参数:体积密度、数密度、线密度、长度密度、周边密度参数等。4.虚拟包容空间构建建立包容空间三维模型。包容空间是指一个有限的空间范围,是盛纳粒子的容器。为了方便计算以及在虚拟切片过程中便于识别截面的投影,我们规定模拟的包容空间为一个等边立方体,由包含三个分量的三元组表示Container(X,Y,Z),X,Y,Z分别代表三个坐标轴。在visual studio中定义为三维浮点型数组:float array[m][n][p]。我们把此包容空间假想为截取一个三维空间X,Y,Z作为粒子存在的环境,该空间的一个特例是三边相等的立方体。5.面向对象的参数化系统设计我们应用面向对象的设计方法(OOP,Ob-ject Oriented Programming),提高本虚拟实验系统的性能。采用面向对象的程序设计技术,首先为模拟的对象定义一个完整的类结构(继承和派生关系),它由概括了一组对象共同性质的数据和函数组成。6.初始化OpenGL环境和参数化图形模块设置环境DC的位图格式(Pixel-Format)属性。由研究者根据需要任意给出各个参数,然后系统根据各参数构造出模型。本系统的模型参数有:粒子数,粒子半径,粒子半径步长,坐标系长度,试验次数,粒子分布类型,切面斜率等。本系统设计人机交互输入参数,并采用一个浮点类型的变量存储。(7)虚拟切片和计量以随即穿过包容空间的二维平面作为随机切片,判断布局粒子是否被击中。粒子的位置属性由其中心坐标确定。位置信息是在粒子生成过程中由随即函数产生。并假定一个平面作为切片,它是以是投影在任意两个平面上的直线方程作为表示方式。判断每个粒子是否被击中并测量被击中粒子截面二维参数。(8)仿真结果与分析根据上述算法,我们在虚拟立方体中建立随机散布粒子系统,并对此虚拟粒子系统进行模拟切片,再由计算机对截面进行判断,并自动计算所有击中粒子截面面积,周长,直径,弦截线长度,截距,交点计数等计量学参数。由用户自定义循环次数n,循环相同切片过程n次,得到n组实验结果。(9)数据拟合检验将所得到的数据进行数值分析,与经典公式进行拟合比较,判断拟合优度。为检验不同曲线拟合效果,我们分别选定密度参数作为检验指标,用originlab origin 7.5对各项数据进行拟合,数值分析的目的是给出各列数据的各项统计参数。确定拟合曲线,并判断拟合曲线是否有统计学意义(P<0.05)。从而确定各参数的最适多项式(P<0.05)。曲线拟合的目的是根据实验获得的数据去建立因变量与自变量之间有效的函数关系。结果第一部分基于MC法的布局算法研究1.均匀性检验:在显著性水平α=0.05下,拒绝域χ0.05,732=90.5,模拟序列均能通过均匀性检验。2.均匀性检验:在100次重复实验中,我们依据区间数k将随机序列的值域划分为不同的等长小区间,以分别选取区间数为k=50,k=75,k=100,并用Pearsonχ2检验不同组别均匀性检验通过率的差别。结果表明,随机序列组数为k=50,k=75,k=100时的均匀性检验通过率分别为:94%,97%,98%。选取不同区间大小之间的序列均匀性差异无统计学意义(P>0.05)3.独立性检验:在一次实验中,取前10阶相关系数,对随机数序列的变量初始化和序列初始化的独立性检验结果表明:自相关系数与零均无显著性差异(P>0.05),在显著性水平α=0.05下接受随机数不相关的假设。4.独立性检验:在100次重复实验中,由变量初始化和序列初始化得到的随机序列独立性检验通过率为92%和94%。5.正态性检验:100次重复实验结果表明:单样本Kolmogorov-Smirnov检验(双尾)P>0.05,偏度系数(g1)和峰度系数(g2)与0的差异不具有统计学意义。第二部分体视学虚拟实验仿真系统设计与实现1.我们采用置信度法检测体视学虚拟仿真实验系统的准确性。对于真值与估计值的判断,估计值与真值的绝对误差<0.01,实际数据有效概率大于标准概率。可以认为仿真数据与真值无统计学差异,模型可信,置信度在95%以上。2.线性拟合结果:由面分析法、线分析法、点分析法三种不同方法所得到的回归方程均成立(P<0.01)。点密度、线密度和面积密度分别与体积密度之间存在依存关系(相关系数为0的概率P<0.001)。3.对于三维结构中体积密度的推断,依据面积密度所得到的拟合曲线拟合最优(拟合的标准差最小)。由此表明,在无法直接测量体积密度的情况下,本系统中面分析法是推断体积密度最优的方法,其次是线分析法,最后是点分析法。但随着样本量增加,三种方法的差异无统计学意义(P>0.01)。4.对于Ewald R.Weibel提出的经典数密度测试公式的拟合检验,以本模型得到的数据进行拟合的结果,粒子数密度确实与面数密度与体积密度变量分别存在幂函数相关关系(P<0.0001)。结论1.本文首次建立了一套体视学虚拟实验计算机仿真系统。建立了粒子布局及生成的几何模型,设计了一个以特例为基础的能够无限次切片的体视学虚拟实验系统,并以计算机软件实现。2.优化了模拟算法。以此算法过程开发的基于微软基本类库的win32应用软件系统能够较好的模拟组织切片的过程。3.在模拟生成随机序列的过程中,我们发现应用微软基本类库中库函数srand()并采用时间函数作为种子的序列生成实验均匀性和独立性检验通过率均不能达到100%。4.我们应用面向对象的设计方法,采用面向对象的程序设计技术,首先为模拟的对象定义了一个完整的类,它由概括了一组对象性质相同的数据和函数组成。类结构具有良好的数据封装性及继承、派生、多态性等特征,不但可清晰有效地封装内联数据和操作,更可用它继承和派生出相关的类结构。5.对于体视学经典公式的检验,本文建立的虚拟实验方法得出的结论模拟值与理论值相符合。