数据泛化论文-尚宇炜,郭剑波,吴文传,苏剑,刘伟

导读:本文包含了数据泛化论文开题报告文献综述及选题提纲参考文献，主要关键词:机器学习,泛化风险,统计学习理论,数据驱动

数据泛化论文文献综述

尚宇炜,郭剑波,吴文传,苏剑,刘伟^[1]（2019）在《数据–知识融合的机器学习(2)：泛化风险》一文中研究指出该文首先概述数据驱动的机器学习模型(data-driven model,DDM)的有关理论研究成果。在此基础上,论证数据–知识融合的学习模型(knowledge-guiding&data-driven model,KDM)在问题的局部学习空间和全域学习空间的泛化性能。结果表明,在有限样本和一定的假设前提下,KDM在局部学习空间的泛化误差以接近概率1收敛于某泛化误差界;在全域学习空间的泛化误差以概率1-δ收敛于某泛化误差界,该界比DDM的泛化误差上界更紧。因此,与单纯DDM相比,KDM的学习过程更加高效、可靠,能够更好地应对实际问题中的少样本学习问题。(本文来源于《中国电机工程学报》期刊2019年16期）

徐婕,贺美美^[2]（2018）在《基于马氏抽样的SVM非平衡数据分类算法的泛化性能研究》一文中研究指出本文将样本为独立同分布的情形减弱为一致遍历马氏链的情形去研究了非平衡数据分类算法的泛化性能,提出了基于马氏抽样的SVM非平衡数据分类算法、基于马氏抽样的EDSVM非平衡数据分类算法和基于马氏抽样的SVM-WKNN非平衡数据分类算法.并用UCI数据库中的10个实际不平衡数据集进行数值实验,实验结果表明基于马氏抽样的上述叁种算法的错分率均比基于随机抽样的对应算法的错分率要低,且上述叁种算法中,基于马氏抽样的SVM-WKNN非平衡数据分类算法的泛化性能最好.(本文来源于《电子学报》期刊2018年11期）

李强,韩雅倩,肖桐,朱靖波^[3]（2018）在《神经机器翻译中数据泛化与短语生成方法研究》一文中研究指出该文对神经机器翻译中的数据泛化方法和短语生成方法进行研究。在使用基于子词的方法来缓解未登录词和稀疏词汇问题的基础上,提出使用数据泛化的方法来进一步优化未登录词和稀疏词汇的翻译,缓解了子词方法中出现的错译问题。文中对基于子词的方法和基于数据泛化的方法进行了详细的实验对比,对两种方法的优缺点进行了讨论和说明。针对数据泛化的处理方法,提出了一致性检测方法和解码优化方法。由于标准的神经机器翻译模型以词汇为基础进行翻译建模,因此该文提出了一种规模可控的短语生成方法,通过使用该文方法生成的源语言短语,神经机器翻译的翻译性能进一步提高。最终,在汉英和英汉翻译任务上,翻译性能与基线翻译系统相比分别提高了1.3和1.2个BLEU值。(本文来源于《中文信息学报》期刊2018年08期）

李爱民,代敏,杨福胜,侯建民,何瑞明^[4]（2018）在《基于PCA-RBF层迭泛化网络的硝酸生产工艺历史数据建模》一文中研究指出硝酸工业对国民经济、国防工业的发展起着重要的支持作用,而成品酸流量是硝酸生产过程重要的技术指标。提出了一种基于层迭泛化策略的成品酸流量的预测建模方法。首先,用主成分分析(PCA)对原始数据降维,提取前5个主成分作为影响因子集合;然后,构建两级RBF网络学习层,第一级针对影响因子空间,对一组RBF神经网络进行交互验证式训练得到输出值和对应的真实值所组成的的特征空间;第二级由单个RBF网络将第一级网络得到的特征空间进行非线性组合;最后,将模型用于预测出口成品酸流量,并与相应实测值进行比较以验证其合理性。结果表明,本文建立的层迭泛化网络模型具有较高的预测精度和泛化性能,对于硝酸生产工艺的分析和优化具有显着的指导意义。(本文来源于《山西化工》期刊2018年02期）

郑明辉,吕含笑,段洋洋^[5]（2018）在《相同敏感值数据集的隐私保护泛化算法》一文中研究指出针对相同敏感值的数据集,定义了其特有的隐私泄露方式,研究了该类数据在同质性攻击下的隐私泄露特点,提出了实例完全泄露风险的概念和计算方法,实现了相同敏感值条件下隐私泄露的准确度量.设计了两种针对相同敏感值数据集进行泛化操作的算法,以相同疾病数据集为实验数据对泛化结果进行对比分析,选择结果较优的泛化算法作为相同敏感值数据集的隐私保护方法.(本文来源于《郑州大学学报(理学版)》期刊2018年02期）

阎永哲,袁红清^[6]（2018）在《泛化背景下大学生学习行为数据壁垒破解研究》一文中研究指出基于相关文献回顾,认为在数字技术背景下,大学生学习行为泛化趋势明显,带来了促进学习内容多样化的正面影响以及割裂学习连续性,减低学习内容深度的负面影响。通过问卷调查,得出"当前学习行为数据壁垒是阻碍潜在数据利益实现"的结论,并提出从"打破数据割据、连通数据孤岛和规范合理使用数据"叁个方面整合数据的建议。(本文来源于《宁波大学学报(教育科学版)》期刊2018年01期）

杨姿,宁博,李毅^[7]（2017）在《基于κ-泛化技术的时空数据个人隐私保护方法》一文中研究指出近些年来,基于位置系统的设备越来越多,从而导致用户的大量位置信息被移动设备获取并利用,从数据挖掘的角度来说,这些数据具有不可估量的价值,但从个人隐私方面来说却恰恰相反,每个人都不希望自己的信息被泄露和利用,从而引发了人们强烈的隐私关注.目前许多文献都提出了隐私保护技术来解决这个问题,概括来说是干扰、抑制和泛化几大类.为了对个人时空数据的隐私进行保护,本文提出了κ-泛化的方法.对用户可能出现的点进行范围限定,更好地提高了数据的可用性;对泛化节点的选取要使得用户的安全性最高;考虑了多个敏感节点存在情况下的解决方案,并且出于提高数据效用的目的对多个敏感节点进行了优化.最后通过实验评估了算法的性能并且验证了算法保护个人隐私是有效的.(本文来源于《华东师范大学学报(自然科学版)》期刊2017年05期）

王妍,王凤桐,王俊陆,宋宝燕,石展^[8]（2017）在《基于泛化中心聚类的不完备数据集填补方法》一文中研究指出随着信息技术、云计算、互联网以及社交网络等技术的不断发展,数据规模呈爆炸态势增长.在海量数据带来丰富信息的同时,如何对海量信息进行高效的预处理成为研究的热点.其中,对于缺失数据的处理就是数据预处理技术中一项重要的挑战.传统的缺失数据的填补方法大部分都只考虑不完备集中数据完全缺失情况下的填补,然而,在海量数据集中,由于人为或者机械等原因会对数据造成一定程度的损坏,有些数据会完全缺失,而有些数据只是部分缺失,传统的填补方法未对不同程度上损坏的数据进行划分,全部按照完全缺失数据进行填补分析,忽略了部分缺失数据对数据填补结果的影响.因此,提出一种基于泛化中心聚类的填补方法(GCF),采用泛化中心聚类思想对数据进行分簇,并对随机损坏数据与聚类结果一起进行缺失数据的填补,以提高填补后数据集的正确率.实验表明,针对不同缺失度的数据集样本,提出的GCF策略在填补正确率方面都具有良好的表现.(本文来源于《小型微型计算机系统》期刊2017年09期）

孙海燕^[9]（2016）在《大数据时代焦虑泛化现象探析》一文中研究指出现代社会进入了大数据时代,而不可避免的是,大数据的不当使用不仅没有凸显其本身的价值,相反还对公众产生了极为不良的影响。纷繁复杂的数据经过"包装",让原本面临各种社会问题的公众越发的焦虑。本文通过对大数据时代焦虑泛化现象的特征和影响进行简要描述,帮助公众探寻科学使用大数据的方法并以此来减轻公众的焦虑情绪。(本文来源于《青春岁月》期刊2016年19期）

杨帆^[10]（2016）在《大数据图像泛化时代下设计价值维度的转向》一文中研究指出目的在当今这个大数据的信息消费时代,科技革命成果的影响渗透到人们日常生活的各个角落;而作为视觉文化艺术重要部分的设计艺术,其设计成果的展陈、推广方式也在由传统的线下空间实体体验向以二维码、APP为代表的线上移动互联网平台的微虚拟空间转型。方法结合移动互联网平台上设计领域中提供的体验为例,以图像学的理论对其分析。结论不同类型产品的APP为其设计提供移动互联网虚拟展示空间平台的全新的试验场,也形成了全新的美学特征,探讨在大数据图像泛化时代下设计价值维度的转向。(本文来源于《包装工程》期刊2016年14期）

数据泛化论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

本文将样本为独立同分布的情形减弱为一致遍历马氏链的情形去研究了非平衡数据分类算法的泛化性能,提出了基于马氏抽样的SVM非平衡数据分类算法、基于马氏抽样的EDSVM非平衡数据分类算法和基于马氏抽样的SVM-WKNN非平衡数据分类算法.并用UCI数据库中的10个实际不平衡数据集进行数值实验,实验结果表明基于马氏抽样的上述叁种算法的错分率均比基于随机抽样的对应算法的错分率要低,且上述叁种算法中,基于马氏抽样的SVM-WKNN非平衡数据分类算法的泛化性能最好.

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据泛化论文参考文献

[1].尚宇炜,郭剑波,吴文传,苏剑,刘伟.数据–知识融合的机器学习(2)：泛化风险[J].中国电机工程学报.2019

[2].徐婕,贺美美.基于马氏抽样的SVM非平衡数据分类算法的泛化性能研究[J].电子学报.2018

[3].李强,韩雅倩,肖桐,朱靖波.神经机器翻译中数据泛化与短语生成方法研究[J].中文信息学报.2018

[4].李爱民,代敏,杨福胜,侯建民,何瑞明.基于PCA-RBF层迭泛化网络的硝酸生产工艺历史数据建模[J].山西化工.2018

[5].郑明辉,吕含笑,段洋洋.相同敏感值数据集的隐私保护泛化算法[J].郑州大学学报(理学版).2018

[6].阎永哲,袁红清.泛化背景下大学生学习行为数据壁垒破解研究[J].宁波大学学报(教育科学版).2018

[7].杨姿,宁博,李毅.基于κ-泛化技术的时空数据个人隐私保护方法[J].华东师范大学学报(自然科学版).2017

[8].王妍,王凤桐,王俊陆,宋宝燕,石展.基于泛化中心聚类的不完备数据集填补方法[J].小型微型计算机系统.2017

[9].孙海燕.大数据时代焦虑泛化现象探析[J].青春岁月.2016

[10].杨帆.大数据图像泛化时代下设计价值维度的转向[J].包装工程.2016

标签：机器学习; 泛化风险; 统计学习理论; 数据驱动;

数据泛化论文-尚宇炜,郭剑波,吴文传,苏剑,刘伟

数据泛化论文文献综述

数据泛化论文开题报告

数据泛化论文参考文献

猜你喜欢