导读:本文包含了混合型数据论文开题报告文献综述及选题提纲参考文献,主要关键词:大数据平台,私有云,物理机,混合
混合型数据论文文献综述
张颢[1](2019)在《私有云和物理机在混合型大数据平台设计中的应用》一文中研究指出本文以混合型的大数据平台设计工作为研究对象,对其中私有云与物理机应用条件作出分析。在介绍异构数据与云平台技术背景条件的前提下,对混合数据平台结构的设计内容展开讨论,在整体系统、私有云结构、数据平台技术、混合数据平台结构的技术内容中,说明数据平台设计方案。另外,也从实用性角度出发技术系统的部署与测试作出分析,以此保证整体数据平台设计的有效性,为技术应用提供完整论证。(本文来源于《电子技术与软件工程》期刊2019年21期)
张乔微,李艳婷[2](2019)在《基于R-Vine Copula的多维混合型数据控制图设计》一文中研究指出多维混合型数据监测问题一直是质量控制和质量管理中的重点和难点。混合型数据包括名义型、顺序型和数值型3种类型。传统的多变量控制图往往只考虑数值型的数据,在应用中存在一定的局限性。同时,在实际场景中,各类变量之间往往存在一定的相关性,这也是在传统控制图中容易被忽略的关键点。本文通过引入Copula-Vine模型,充分利用了顺序型变量的秩相关性,建立了一种新的基于R-Vine Copula的混合型数据控制图(R-Vine Copula control chart, RVC)。通过算例比较,验证了该控制图相对于现有模型在混合型数据监测方面更强的灵活性和有效性。(本文来源于《工业工程》期刊2019年05期)
张建坤,禹思敏[3](2019)在《面向混合型位置大数据的差分隐私聚类算法》一文中研究指出针对现有的差分隐私聚类算法仅局限于实型数据的问题,提出一种基于混合型位置大数据的差分隐私聚类算法DPKD。利用KD-medoids降维聚类算法对混合型位置大数据进行预处理,提取位置信息记录,采用邻近搜索找出聚类中心点,划分为k个聚类簇,添加Laplace噪声使其满足差分隐私,通过查询函数返回待发布的数据记录;分析DPKD算法数据查询误差高的问题,对初始中心点优化选择,提出一种改进的Op-DPKD算法。性能评估结果表明,Op-DPKD算法解决了混合型位置大数据的隐私保护问题,提升了聚类效果,保证了混合型位置大数据的可用性。(本文来源于《计算机工程与设计》期刊2019年09期)
王志虎[4](2019)在《无线传感网络混合型数据高效存储方法仿真》一文中研究指出当前采用的混合型数据存储方法存在丢包率高、能耗高等问题,为了解决上述问题,提出了基于无线传感网络的混合型数据高效存储方法,利用基函数实现信息表征空间的变换,通过求解特征空间基的方式,去除传感网络感知的混合数据中的噪声,完成对混合型数据特征的提取;将上述提取特征后的混合型数据作为存储样本。存储数据时如果没有采用强度和最小传输粒度等数字特征作为存储参数,那么将随机选择一条传感网络链路进行数据传输。当最小传输粒度的一阶矩符号是负数时,要调整数据粒度,利用这个粒度对数据存储采用强度数字特征时完成超带宽控制。根据弹性系数与强度数字特征之间的关系,实现对无线传感网络混合型数据的高效存储。仿真结果表明,所提方法能够在低丢包率、低能耗的情况下实现对混合型数据进行高效存储。(本文来源于《计算机仿真》期刊2019年07期)
李鑫[5](2019)在《基于混合型数据表示的聚类集成算法》一文中研究指出聚类分析是数据挖掘中的一个重要研究领域,已被广泛应用于图像处理、信息检索和生物信息学等研究领域。目前,已有多种聚类算法被发展。由于数据的复杂性,单一聚类算法无法有效地完成聚类任务。如何将多个聚类结果进行融合(即聚类集成)已成为聚类分析的一个重要研究内容。在聚类集成过程中,集成结果的有效性容易受到基聚类的质量的影响。为此,本文针对该问题开展了深入的研究工作,其中主要的研究成果包括如下:(1)将基聚类看作数据的符号特征与其原有特征进行合并,提出了一种基于混合型数据表示的聚类集成算法。该算法对K-Prototypes算法进行扩展,通过不断迭代更新基聚类,使得获得的集成结果同时对原数据类结构和基聚类具有较高的一致性。在UCI数据集上将新算法与其它聚类集成算法进行了实验比较分析。实验结果表明提出的算法相比其它算法能够在测试数据集上获得更加有效性的集成结果。(2)在第一项研究工作的基础上,本文将原数据特征信息、监督信息和基聚类信息进行融合,提出了一种基于混合型数据表示的半监督聚类集成算法。该算法利用非负矩阵分解聚类算法获得和更新基聚类。获得的聚类结果同时对原数据特征信息、监督信息与基聚类信息有着较高的一致性。新算法与已有的若干个聚类集成算法在UCI数据集上进行了实验比较。实验结果表明新算法在测试数据集上获得的聚类结果相比其它算法有着较高的聚类精度。(3)本文从原数据特征空间和基聚类所构建的符号特征空间两个角度评估了基聚类的质量,提出一种二次加权聚类集成算法。新算法首先利用基聚类生成的目标函数对其进行评价加权,刻画它在原数据特征空间上的质量。进一步利用W-K-Modes算法对基聚类进行二次加权,反映它在符号特征空间上的质量。将新算法与其它集成算法在数据集上进行实验比较。实验结果展示了相比其它算法,新算法可以在测试数据集上获得更好的聚类结果。针对已有大多聚类集成算法仅考虑基聚类的一致性从而忽略了基聚类的质量对集成结果的影响问题,本文从不同的角度提出了叁种解决方法。所提的新方法进一步丰富了聚类分析技术,为多聚类结果融合提供有效的技术支持。(本文来源于《山西大学》期刊2019-06-01)
刘超,姚清华,乐然[6](2019)在《混合型数据聚类方法的比较》一文中研究指出为了科学使用真实世界数据,探索适用于日益常见的混合型数据的聚类方法,文章分析和比较了两种典型的混合型数据聚类方法K-prototypes与ClustMD,改进了聚类方法关键参数选择方法,并提出聚类稳定性指标。结果表明,两种聚类方法均具有很高的有效性和稳定性,各有优缺点。当数据相关性强、数据缺失严重或非连续变量较多时,建议使用K-prototypes。(本文来源于《统计与决策》期刊2019年11期)
李鑫,白亮[7](2019)在《一种基于混合型数据表示的聚类集成算法》一文中研究指出将基聚类与原数据看作一个混合型数据,提出了一种基于混合型数据表示的聚类集成算法.该算法通过不断迭代更新以获得更好的基聚类,且结果保持了对原数据类结构和基聚类的一致性.与其他聚类集成算法进行了比较,结果表明,基于混合型数据表示的聚类集成算法是有效的.(本文来源于《郑州大学学报(理学版)》期刊2019年02期)
张猛猛[8](2018)在《多元混合型纵向数据中基于copula的广义线性混合模型》一文中研究指出对多元纵向数据分析时,其建模难度要远远高于一元的情形.这主要是因为不仅要考虑一个个体的多次观测在时间上的相依性,还要考虑在同一时间点的各个响应变量之间的相关性.在本文中,我们提出了一个基于copula的广义线性混合模型去联合分析多响应的混合型纵向数据,可以处理包含连续性,计数型及二元型变量的数据.一方面,我们使用广义线性混合模型对纵向数据中重复测量之间的相依性进行建模.另一方面,我们使用D-vine copula去衡量不同响应变量之间的相关性.通过将混合效应模型和D-vine模型的结合,我们提出的模型不仅可以处理包含不同边际分布的非平衡的数据,而且还可以处理高维的问题.基于D-vine copula,我们提出了混合型数据的采样算法以及计算似然函数的算法.对于广义线性混合模型,我们不指定随机效应的分布,使用非参数的方法对模型进行拟合,然后利用EM算法去求得参数的极大似然估计.通过对实际数据的分析以及我们的模拟结果表明,非参数的方法要比传统的参数化的方法更高效和灵活。(本文来源于《中国科学技术大学》期刊2018-05-28)
林强,唐加山[9](2019)在《一种适用于混合型分类数据的聚类算法》一文中研究指出传统的K-modes算法采用简单的属性匹配方式计算同一属性下不同属性值的距离,并且计算样本距离时令所有属性权重相等。在此基础上,综合考虑有序型分类数据中属性值的顺序关系、无序型分类数据中不同属性值之间的相似性以及各属性之间的关系等,提出一种更加适用于混合型分类数据的改进聚类算法,该算法对无序型分类数据和有序型分类数据采用不同的距离度量,并且用平均熵赋予相应的权重。实验结果表明,改进算法在人工数据集和真实数据集上均有比K-modes算法及其改进算法更好的聚类效果。(本文来源于《计算机工程与应用》期刊2019年01期)
梁欢[10](2018)在《一种改进的适用于混合型数据的快速聚类算法》一文中研究指出Rodriguez和Laio在2014年提出的快速聚类算法(RL算法),由于可以识别任意形状的类簇,且不需设定最终聚类的个数k,而被广泛应用。因为混合型数据集样本点之间的距离计算较为复杂,每个样本点密度的定义较为困难,所以很少有研究者把快速聚类算法运用到混合型数据集上,但实际生活中的大部分数据都是混合型的,于是我们提出一种改进的适用于混合型数据的快速聚类算法(算法2),这个方法是基于RL算法改进的,适用于混合型的数据集。算法2首先定义了混合型数据集的距离度量,然后用类中心自动选择算法(算法1)选择出可能的类中心,接着将剩余点一一归到比之密度更高离得最近的那个点所属的类,最后进行类合并同时输出最终结果。当数据量很大,距离计算的复杂度和时间会以平方的速度增加,为达到缩减计算复杂度和时间的目的,文章用算法2结合滑动窗口模型的方法进行大样本混合型数据的聚类。最后用UCI里的几组数据集来验证算法的有效性。(本文来源于《兰州大学》期刊2018-04-01)
混合型数据论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
多维混合型数据监测问题一直是质量控制和质量管理中的重点和难点。混合型数据包括名义型、顺序型和数值型3种类型。传统的多变量控制图往往只考虑数值型的数据,在应用中存在一定的局限性。同时,在实际场景中,各类变量之间往往存在一定的相关性,这也是在传统控制图中容易被忽略的关键点。本文通过引入Copula-Vine模型,充分利用了顺序型变量的秩相关性,建立了一种新的基于R-Vine Copula的混合型数据控制图(R-Vine Copula control chart, RVC)。通过算例比较,验证了该控制图相对于现有模型在混合型数据监测方面更强的灵活性和有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
混合型数据论文参考文献
[1].张颢.私有云和物理机在混合型大数据平台设计中的应用[J].电子技术与软件工程.2019
[2].张乔微,李艳婷.基于R-VineCopula的多维混合型数据控制图设计[J].工业工程.2019
[3].张建坤,禹思敏.面向混合型位置大数据的差分隐私聚类算法[J].计算机工程与设计.2019
[4].王志虎.无线传感网络混合型数据高效存储方法仿真[J].计算机仿真.2019
[5].李鑫.基于混合型数据表示的聚类集成算法[D].山西大学.2019
[6].刘超,姚清华,乐然.混合型数据聚类方法的比较[J].统计与决策.2019
[7].李鑫,白亮.一种基于混合型数据表示的聚类集成算法[J].郑州大学学报(理学版).2019
[8].张猛猛.多元混合型纵向数据中基于copula的广义线性混合模型[D].中国科学技术大学.2018
[9].林强,唐加山.一种适用于混合型分类数据的聚类算法[J].计算机工程与应用.2019
[10].梁欢.一种改进的适用于混合型数据的快速聚类算法[D].兰州大学.2018