论文摘要
函数性数据分析是把观测数据yi=(yil…,yiTi)′看成一个整体,表示为光滑曲线或连续函数ui(t),i=1,2,…,N,然后从函数视角对其进行分析。与传统的分析方法相比,函数性数据分析具有其自身的优越性,它依赖较少的假设条件和较弱的结构约束,不要求不同观测对象的数据观测点和观测次数相同,不但可以实现对无限维度数据(即这里所谓的函数性数据)的模式挖掘,而且还可用于对非函数性数据进行分析。函数性数据分析的一个重要的特性是可以求出导数曲线或微分曲线,通过对它们的分析能够挖掘出更多的重要信息,例如对一阶或高阶导数曲线的分析可探索曲线之间的差异和曲线内部动态变化模式等。面向函数性数据的挖掘已引起国内外学术界的关注,并取得了丰硕的研究成果,在增长分析、气象学、生物力学、经济学、医学等许多领域具有广阔的应用前景。国内外关于函数性数据分析的研究还处于起步阶段,还有许多问题需要进一步研究;从应用领域来看,极少用于对经济数据的分析研究。论文以“函数性数据分析方法及其应用研究”为题,从思想、理论和技术方法等方面对函数性数据分析方法进行了系统概括,主要包括函数性数据的预处理、线性回归分析、主成份分析、聚类分析、典型相关分析和判别分析等,并在此基础上进行方法及其在经济数据分析中的应用研究。论文的创新之处主要体现在以下几个方面:(1)提出基于回归系数函数的函数线性模型。与三种基本的函数线性模型相比,这种方法提高了模型的可估计性,不仅可以从动态角度对经济现象进行传统的分析预测,而且可以从连续的视角揭示经济现象发展变化的速度、加速度等更深层次的动态规律性,体现出了函数性数据分析的实用性。(2)提出一种基于里程碑的、同时根据序列数值和序列形状模式进行相异性测度的聚类方法。这种方法克服了基于序列数值模式测度相似性的聚类方法不考虑轨迹形状、而基于序列形状模式测度相似性的聚类方法忽略了序列数值所代表的相似信息和趋势信息的缺陷,在高频金融时间序列的聚类分析中具有现实意义。(3)对函数性数据分析方法在经济数据分析中的应用进行研究和拓展。将函数性回归分析、主成份分析、聚类分析和典型相关分析分别用于研究城镇居民消费倾向的发展变化趋势、国家财政主要支出项目的主要变化模式、构成上证50指数的股票的高频金融时间序列聚类问题和我国29个地区城镇居民家庭人均可支配收入与消费性支出的共变模式等。(4)在将函数性数据分析方法运用于经济数据分析的过程中,挖掘出一些用传统分析方法不易识别的经济规律。例如,城镇居民家庭人均消费的回归分析结果显示,边际消费倾向的变化在时间上稍微滞后于基本消费的变化,表明对于收入的变化的反应,边际消费倾向变化的灵敏性要弱于基本消费变化的灵敏性;城镇居民家庭人均可支配收入与消费性支出的典型相关分析显示,在可支配收入水平较高的地区,消费性支出的变化不完全是收入变化的结果,消费水平的提高可能会促使收入的增加,因此扩大消费品的种类和提高消费品的质量可能促使该地区的内需增加;在可支配收入处于中等和较低水平的地区,消费性支出的变化主要受收入变化的影响,因此提高居民的收入水平能促使消费的增加,从而促使该地区的内需增加等。