论文摘要
本文以统计关系学习这一新兴研究领域为背景,展开统计关系模型学习方法的研究。在总结、分析统计关系学习的基本方法、研究现状和所面临的挑战基础上,结合进化计算、粒子群算法和免疫机制等,重点研究了学习复杂统计关系模型、在背景知识不完全的条件下扩充其表达能力、不完备关系数据下学习统计关系模型以及统计关系模型的通用(统一)学习方法等问题。论文的主要工作包括:(1)对统计关系学习的研究现状、研究方法以及未来的挑战等进行了综述;(2)对关系数据的特征,关系数据和传统数据表示形式的异同,以及避免影响统计关系模型学习的方法进行了分析和讨论;(3)针对当前统计关系模型结构学习的难点提出一种基于模板的子句学习方法,该方法先学习一种中间结构,从而缩小搜索空间,之后再将该结构转化为子句;(4)将基于模板的子句学习方法应用于完备关系数据条件下Markov逻辑网(一种有代表性的统计关系模型)的学习,该方法使用粒子群算法学习统计关系模型的参数,适于对较大的数据集进行学习;(5)针对不完全的背景知识(谓词不充分),将基于模板的学习方法与免疫机制相结合,提出从关系数据中生成新谓词以扩充背景知识的方法;(6)将基于模板的学习方法与期望最大化算法结合提出一种从存在缺失值的关系数据集(一种不完备的关系数据形式)中学习Markov逻辑网的算法,该方法在每步迭代中用更好的结构取代原来的结构,从而最终获得更接近实际的Markov逻辑网;(7)结合上述研究结果给出了一种通用的统计关系模型学习方法,该方法能对大多数的统计关系模型进行学习。本文获得的结果对深入统计关系学习和多关系数据挖掘研究有较大意义。
论文目录
相关论文文献
标签:统计关系学习论文; 统计关系模型论文; 关系数据库论文; 统计关系模型学习论文; 参数学习论文; 结构学习论文; 完备关系数据论文; 不完备关系数据论文; 数学期望论文; 粒子群算法论文; 免疫机制论文; 遗传算法论文;