缺失数据下两样本差异指标的经验似然推断

缺失数据下两样本差异指标的经验似然推断

论文摘要

总体差异检验在许多实际应用中是相当广泛的,例如医学研究。在本文中,我们利用概率理论来判定两样本间的差异所具有的性质。在实际中,我们经常得到如下不完全样本:样本和样本其中样本和样本都缺失,即本文中,我们假定X,Y都是完全随机缺失(MCAR)(参见即X、Y的缺失满足(与x无关的常数)、(与y无关的常数),且( X ,δX),(Y ,δY)是相互独立的。通常的理论推断在这些有缺失样本的情形下不能直接应用,处理不完全样本的基本方法是对那些缺失的样本观测值进行补足,再应用标准统计方法将其看作实际观察中的完全数据处理,补足方法主要有固定补足和随机补足两种(参见Rao(1996))。本文在第一章中假定和是来自总体x, y中的简单随机样本)都未知。令分别用表示对X,Y的n和m个观测值中未缺失个体的集合; ,s n x sm y分别表示X和Y的n和m个观测值中缺失个体的集合。此时用如下方法补足:记{ , }xi i∈snx为从{ , }xi i∈srx中独立随机抽取的n x个样本,将其作为X的补足数据.类似可得y?j。令表示X和Y补足后的完全数据样本。令θ0,θ1分别是关于F和G的指标,且? =θ1 ?θ0。设已知下列信息:其中ωi , i= 1,2,为已知函数。考虑似然函数:其中则(2)的最大值是n-nm-(m)。考虑关于?的经验似然比统计量:其中满足约束条件利用拉格朗日乘子法,可得对数经验似然比统计量为:其中由下式确定令得如下经验似然方程:都存在首先给出如下正则条件:为开区间。连续和的某邻域内以某可积函数作为上界和的某邻域内以某可积函数作为上界定理1若条件1一3满足,则存在的一个根使得点达到极大值,且本文在第二章中假定x:,i=1,…,n,是来自总体x中的简单随机样本,知其中,是来自总体y中的独立随机样本的形式已知,为未知参数。分别用表示对的n和m个观测值中未缺失个体的集合分别表示X和Y的n和m个观测值中缺失个体的集合。此时用如下方法补足:中独立随机抽取的n x个样本,将其作为X的补足数据。取来补足Y缺失的数据,其中θ^是θ基于{ , }yl l∈sry下的极大似然估计。令表示X和Y补足后的完全数据样本。对固定的0 < q< 1,用F ?1 ( q),G ?1 ( q)分别表示x ,y的q分位数(假定它们均唯一确定),记设y的密度存在且为0gθ( y),考虑经验似然函数:其中则(2.1)的最大值是取取Borel可测函数类似于Hall(1993)的方法,考虑关于?的经验似然比统计量:其中p1 , , pn满足约束条件令由利用拉格朗日乘子法可得对数经验似然比统计量其中λ(θ)由下式确定得如下经验似然方程:其中此处假减存在,用00表示0的真值。首先给出如下正则条件:1.00E几,几为开区间。2.Y的分布乓(力有共同支撑,即集合A一{厂g。(y)>0}与0无关。3.对任意y EA,g。(力关于0三次连续可微。;对任霆,存在;对任j;对任意存在且在θ0的某邻域内连续,5.Fisher信息阵:满近67.对某个整数‘>2,f(.)和f卜‘(.)在刀,的某个邻域内存在且在刀,点连续,f(几)>0,其中f(.、一F’(.)。89.K(.)有界且满足LIPschitz条件,K,(.)存在且有界;对任意给定的常数。>0,10.且存在)使携11.日其中定理2若条件1-11满足,则存在(17)的一个根,点达到极大值,,且

论文目录

  • 摘要
  • Abstract
  • 引言
  • 第一章 缺失数据下两样本一般差异的经验似然置信区间
  • §1.1 模型及相关条件
  • §1.2 主要结果
  • §1.3 基本引理
  • §1.4 定理的证明
  • 第二章 缺失数据下两样本半参数模型的分位数差异的经验似然置信区间
  • §2.1 模型及相关条件
  • §2.2 主要结果
  • §2.3 基本引理
  • §2.4 定理的证明
  • §2.5 模拟结果
  • 参考文献
  • 附录
  • 致谢
  • 相关论文文献

    标签:;  ;  ;  ;  ;  

    缺失数据下两样本差异指标的经验似然推断
    下载Doc文档

    猜你喜欢