论文摘要
在经典的线性回归模型中,观测值的方差齐性是一个基本的假定.在此假定下,方可进行常规的统计推断.若方差非齐而且未知,则回归分析将会遇到诸多问题.人们发现在现实生活中,异方差数据是大量存在的,所以观测值的方差齐性这种假定有时并不切合实际.若方差非齐,我们称为异方差.处理异方差的方法常见的有两类.第一类,数据变换法,如方差稳定化变换和经典的Box-Cox变换.经过变换后转化为同方差处理.第二类,方差建模法.不仅对均值而且也对方差建立统计模型,称为异方差回归模型,我们也称之为均值-方差模型.该模型的主要特点就是体现在对方差的重视,它能更好的解释数据变化的原因和规律,这也是数据分析中一个重要的发展趋势.因此,对均值-方差模型进行系统深入地研究是十分必要的.另外众所周知,变量选择是现代统计分析中的一个重要内容,也是当今研究的热点课题.目前,大多数文献集中于对均值回归模型的变量选择,然而对均值-方差模型同时进行变量选择的研究还不多见.我们也明白,均值-方差模型同时变量选择对了解复杂的社会经济现象和工业产品的质量改进试验具有十分重要的意义.本论文针对异方差回归模型,主要系统研究了均值方差联合建模结构下的统计推断问题,包括高维数据、纵向数据和偏态数据等复杂数据下双重广义线性模型和半参数均值方差模型等异方差回归模型的变量选择问题、方差齐性检验问题以及贝叶斯估计问题.具体地讲,论文的研究内容有以下几个方面:对高维数据下双重广义线性模型,提出了一个基于惩罚伪似然的变量选择方法.该方法能同时选择均值模型和方差模型中参数部分的重要解释变量.进一步地,对于适当选取的调整参数,证明了这种变量选择方法是相合的,回归系数的估计具有Oracle性质.最后通过随机模拟和实际例子分析研究了所提出方法的有限样本性质.其次,在纵向数据下,我们联合对均值和协方差矩阵进行建模,基于惩罚似然的思想提出了一种变量选择方法.针对协方差矩阵分解我们使用了一种新的分解方法,它具有滑动平均模型的解释.该方法能对均值和协方差结构进行同时变量选择,这样可以减少模型偏差和模型复杂度.在一些正则条件下,也证明了惩罚极大似然估计具有渐近相合性和渐近正态性.随机模拟结果也表明所提出的变量选择方法是有效的.对半参数均值方差模型,基于限制似然和惩罚似然的思想提出了一种可行的变量选择方法.在模型中,非参数部分采用B样条逼近.在适当选取的调整参数下,证明了变量选择的相合性.我们的方法能同时对均值模型和方差模型进行变量选择和参数估计,并且得到的非参数估计也能达到最优的收敛速度.另外,通过随机模拟和实例分析表明所提出的方法具有较好的有限样本性质.对双重logistic模型,考虑其在妊娠期高血压疾病危险因素分析中的具体应用,采用目前比较流行的系数压缩变量选择方法,对危险因素进行变量选择和参数估计.然后基于参数估计提出了一种比较客观的预测方法,并且把基于惩罚扩展拟似然估计的预测结果与基于经典的散度不带结构的极大似然估计得到的预测准确率做比较,得出基于双重logistic模型得到的预测准确率比较高的结论.同时也发现通过变量选择,剔除了很多对妊高病影响很小或者根本不影响的变量,并且最后做预测分析的结果也要比不剔除变量的结果要高,这也说明我们的变量选择方法对于此项研究起到了很大的作用.对偏正态半参数变系数模型,基于B样条逼近给出了模型中的参数部分与非参数部分的估计,也证明了给出的参数估计是相合的和非参数估计达到了最优的非参数收敛速度.其次,对模型进行了异方差检验.我们提出用score检验统计量来实现了对模型的异方差检验.最后通过随机试验结果表明我们的估计方法和检验方法是可行的.最后,基于B样条逼近非参数函数,考虑了半参数均值方差模型的贝叶斯估计.应用联合Gibbs抽样和Metropolis-Hastings算法的有效MCMC算法来获得模型中未知参数的贝叶斯估计.通过模拟研究和实际数据分析来说明所提出的贝叶斯分析方法是有效的.