论文摘要
试验设计在统计学的课程、应用和研究等方面扮演着重要的角色。我们关于科学准则、工程中的产品及制造过程等方面的许多知识都是通过试验获得的。试验设计是制定试验策略的工具,它能够用最少的试验次数来最大化得到的信息。传统的试验设计,例如因析设计、正交设计、区组设计、拉丁方设计和响应曲面设计已被深入研究,得到了丰硕的理论成果。本文研究试验设计中的一些最新课题,包括计算机试验中嵌套正交拉丁超立方体设计的构造、分片正交且最大最小拉丁超立方体设计的构造,以及最少点混水平筛选设计的构造。在试验的初级阶段,试验的目的是要识别出对试验过程重要的因子。分辨度为Ⅲ和Ⅳ的部分因析设计常被用作筛选设计。但是用这些设计来识别活跃因子的时候有一些缺点,例如:对于任意一个分辨度Ⅲ的部分因析设计,某些主效应会和一个或多个二阶交互效应完全混杂。这时候需要追加试验来确定活跃的效应。如何构造具有良好性质的筛选设计是一个重要的课题。对于因子全为两水平或三水平的筛选设计,已有文献提出了相应的构造方法。但是,有些试验既有两水平因子又有三水平因子。目前尚没有人给出混水平筛选设计的构造方法。本文给出一种构造混水平筛选设计的方法,得到的设计具有最少的试验点,而且在D效率和估计的方差方面都有很好的表现。传统的试验是在实验室、工厂或者农田里实施的。随着计算机技术的迅速发展,一些实体试验可以用复杂的计算机程序进行模拟。计算机试验中不存在随机误差。在计算机试验中,对给定的一组输入值,得到的响应是确定的。因此,传统的试验设计准则,即随机化、分区组和重复,在计算机试验的设计和分析中不再适用。由Mckay, Conover and Beckman (1979)提出的拉丁超立方体设计在计算机试验中得到了广泛的应用。拉丁超立方体设计最初的构造方法是每一列随机抽取1到n的一个排列,其中n是试验次数。这种构造方法可能导致某些因子之间具有很强的相关性。因子之间存在很强的相关性会使得后续的数据分析变得复杂,而且会更难识别出重要的因子。对于回归模型来说,包含正交变量是合乎需要的,这样能够保证系数的估计之间是不相关的。对于一阶回归模型来说,正交性可以确保主效应的估计是不相关的。进一步,对于一阶回归模型但二阶效应(即平方效应和两因子交互效应)存在的情形,能够保证所有主效应的估计与二阶效应的估计不相关的设计是优先采用的。构造具有以下优良性质的拉丁超立方体设计是一个很重要的课题:(a)主效应的估计之间不相关;(b)主效应的估计与平方效应和两因子交互效应的估计不相关。二阶正交的拉丁超立方体设计能够满足性质(a)和(b).一个列中心化的拉丁超立方体设计是二阶正交的,如果满足:任意两列的内积为零,而且任意三列的对应元素乘积之和为零。具体定义将在第一章中给出。现有文献中有一些方法来构造具有性质(a)和(b)的拉丁超立方体设计,参见Ye (1998), Cioppa and Lucas (2007), Georgiou (2009), Sun, Liu and Lin (2009,2010), Yang and Liu (2012)和Ai, He and Liu (2012)等.一个像有限元分析模型这样的复杂费时的计算机程序可以分成不同的精度来实施,这就产生了具有多个精度的计算机试验。通常地,会同时用一个高精度(费时)的计算机试验和低精度(运算快)的计算机试验来研究复杂的实体系统。这种试验得到的观测通常用来构建统计模型,以用来预测试验的最精确的响应(Kennedy and O’Hagan (2000), Qian, Seepersad, Roshan, Allen and Wu (2006) and Qian and Wu (2008)).有效的数据收集对这种试验的实施是至关重要的。Qian, Tang and Wu (2009)针对具有高精度和低精度的计算机试验提出了一类新的设计,称为嵌套空间填充设计。考虑k个不同精度的计算机试验,响应分别是y1….,yk,其中y1来自于最高精度的试验,y2来自第二高精度的试验,以此类推。令D1…,Dk表示这k个试验的设计阵。那么D1…Dk通常要满足下面的条件:(1)嵌套结构:D1(?)…(?)Dk;(2)空间填充性质:每个Di都是空间填充设计。拉丁超立方体设计具有一维投影均匀性。构造具有良好性质的嵌套拉丁超立方体设计,如嵌套正交拉丁超立方体设计,是一个很好的课题。目前只有个别的工作构造了嵌套正交拉丁超立方体设计。Li and Qian (2013)针对两精度的计算机试验,给出了几种方法来构造(近似)列正交的嵌套拉丁超立方体设计。本文给出了适用于多精度计算机试验的嵌套正交拉丁超立方体设计的构造方法,并且,所构造的设计是二阶正交的。此外,对一个计算机试验,通常都假设其变量是定量的。但是,一个计算机试验可能同时包含定性和定量的变量。Qian and Wu (2009)提出的分片空间填充设计对同时包含定性和定量变量的计算机试验是个很好的选择。空间填充设计的每一片对应着定性因子的一个水平组合,且在低维上都应具有空间填充性质。Qian(2012)构造了具有一维投影均匀性的分片拉丁超立方体设计。正交性是空间填充设计应具有的重要性质。目前只有Yang, Lin, Qian and Lin (2013)的工作来构造分片正交拉丁超立方体设计。他们给出了几种方法来构造分片正交或者二阶正交的拉丁超立方体设计。而且,现有的方法在构造分片拉丁超立方体设计时只考虑了正交性或者一维投影均匀性。将正交性和高维投影均匀性一起来考虑是个新的课题。尽管现在已有一些方法来构造嵌套空间填充设计、分片空间填充设计和筛选设计,如上所述,目前还有不少新问题需要解决。下面我们简要介绍本论文各章的主要内容。第一章介绍一些背景知识,相关的概念、符号以及在后面章节中要用到的引理。第二章给出一类嵌套正交拉丁超立方体设计的构造方法。嵌套拉丁超立方体设计是针对多精度的计算机试验提出来的。正交性已被证明是很重要的性质。嵌套正交拉丁超立方体设计的构造只有很少量的工作。现有的构造嵌套正交拉丁超立方体设计的方法只能得到某些特定层数的设计。本章利用正交设计来构造具有两层或多层结构的嵌套正交拉丁超立方体设计。得到的嵌套设计的层数可以是任意的正整数。新的设计还具有以下性质:任意三列对应元素乘积之和为零,该性质对因子筛选具有很好的用处。这些设计能够保证所有主效应的估计与平方效应及两因子交互效应的估计不相关。这种构造方法很容易实施。第三章给出了分片正交且最大最小拉丁超立方体设计的构造。分片拉丁超立方体设计是一种特殊的拉丁超立方体设计,能够被分成若干片,并且每一片是一个小的拉丁超立方体设计。这种设计对具有定性和定量因子的计算机试验、多精度试验、数据整合和交叉验证很有用。正交性和均匀性对拉丁超立方体设计来说是很重要的性质。在本章中,我们用正交设计、Goethals-Seidel表和Kharaghani表来构造分片正交且最大最小拉丁超立方体设计。所构造的设计不仅具有二阶正交性,而且具有用最大最小距离准则度量的很好的均匀性。第四章介绍了一种用Conference矩阵来构造最少点混水平筛选设计的方法。筛选设计经常被用来识别大量因子中的活跃效应。当试验的花费较昂贵时,试验次数少的设计是优先考虑的。两水平或三水平的最少点筛选设计在文献中已经得到了很好的研究。但是,最少点的混水平筛选设计尚未得到研究。在本章中,我们用Conference矩阵来构造一类新的最少点混水平筛选设计。所构造的设计可用来估计主效应和平方效应,而且估计的D效率和方差都有很好的表现。第五章对本文的工作进行了总结与讨论。
论文目录
相关论文文献
标签:混水平论文; 最大最小距离论文; 最大行列式矩阵论文; 嵌套拉丁超立方体设计论文; 正交设计论文; 正交性论文; 分片正交拉丁超立方体设计论文;