论文摘要
偏最小二乘法(PLS)是构造回归方程的一种较新的多元统计方法,最早由化学界的S.Wold在1983年提出,后来日益受到统计界的关注。许多统计学家都对这种方法进行了研究。这种方法不但可以用于单变量的回归分析,而且可以用于多元变量回归分析。其中,偏最小二乘回归相当于普通线性回归、主成分分析、典型相关分析的组合,即(PLS≈多元线性回归+主成分分析+典型相关分析)。当数据中存在共线性,或样本容量小于自变量个数时,构造新的解释变量,对新的解释变量使用最小二乘(OLS)来确定因变量与自变量间的回归方程。PLS构造新解释变量的目的是,使构造的新解释变量包含自变量最大的信息,消除数据中共线性的影响,利于对因变量的预测,同时,通过使用比自变量个数少的成分来降低回归问题的维度。本文在总结多元线性回归模型基础上,进一步认识到其存在的多重共线性问题,提出用偏最小二乘回归模型定义:从多元线性回归、主成分分析以及典型相关分析相结合三个层面上提出了偏最小二乘回归模型。从理论和实证方面证明偏最小二乘回归模型更科学、合理;在论文最后一章中运用偏最小二乘回归方法,分析了影响黑龙江省消费水平的4个因素,研究表明了2000年以来,黑龙江省的消费能力与物价,就业人数作用明显。基于文章中的分析结论,黑龙江省的消费水平的增高取决于要解决好人员就业等问题。另外,将成分数据的对称logratio变换方法与PLS(偏最小二乘)回归相结合,提出在因变量是成分数据,自变量也是成分数据的情况下,建立了线形回归模型的方法。该模型方法可以满足成分数据的定和约束,克服成分数据中完全多重共线性对模型的不良影响,并且突出成分数据主题含义在建模中的作用和意义。根据提出的新方法,建立了中国就业结构模型。
论文目录
摘要ABSTRACT第1章 绪论1.1 背景1.2 国内外的研究现状1.3 研究的基本内容及理论依据1.3.1 基本内容1.3.2 基本理论依据1.4 结构安排第2章 线性回归分析2.1 回归分析研究起源2.2 多元线性回归模型2.2.1 多元线性回归模型的一般形式2.2.2 多元线性回归模型的基本假定2.3 回归参数的估计2.3.1 回归参数的普通最小二乘估计2.3.2 回归值与残差2.4 参数估计的性质2.5 回归方程的显著性检验2.5.1 F检验2.5.2 回归系数的显著性检验2.5.3 回归系数的置信区间2.5.4 拟合优度2.6 中心化和标准化2.6.1 中心化2.6.2 标准化2.7 本章小结第3章 回归模型中的多重共线性问题3.1 多重共线性产生的背景和原因3.2 多重共线性对回归模型的影响3.3 多重共线性的诊断3.4 消除多重共线的方法3.5 本章小结第4章 主成分分析方法与典型相关分析4.1 主成分分析的基本原理4.2 主成分分析的基本定义和性质4.3 样本主成分4.4 主成分分析的基本算法和步骤4.5 典型相关分析的基本思想4.6 典型相关分析的基本原理4.7 典型相关分析的计算方法4.7.1 样本典型相关的计算方法4.7.2 典型相关系数的显著检验4.8 本章小结第5章 偏最小二乘回归的线性模型5.1 基本思想5.2 模型推导5.3 基本性质5.4 交叉有效性5.5 本章小结第6章 偏最小二乘回归的实证分析6.1 基于偏最小二乘回归对黑龙江省消费水平分析6.1.1 建模思想6.1.2 算法推导6.1.3 黑龙江省消费水平建模6.1.4 最小二乘回归模型6.1.5 偏最小二乘回归模型6.1.6 结论6.2 基于PLS回归的成分数据对就业结构分析6.2.1 算法步骤6.2.2 基于PLS回归分析的成分数据预测模型的建立与求解6.2.3 三大产业的就业结构分析6.3 本章小结结论参考文献攻读硕士学位期间发表的论文和取得的科研成果致谢
相关论文文献
标签:偏最小二乘回归论文; 多重共线性论文; 交叉有效性论文; 成分数据论文; 对称变换论文;