导读:本文包含了数据集成与更新论文开题报告文献综述及选题提纲参考文献,主要关键词:SMOTE,Boosting,不平衡数据,集成学习
数据集成与更新论文文献综述
陈圣灵,沈思淇,李东升[1](2018)在《基于样本权重更新的不平衡数据集成学习方法》一文中研究指出不平衡数据的问题普遍存在于大数据、机器学习的各个应用领域,如医疗诊断、异常检测等。研究者提出或采用了多种方法来进行不平衡数据的学习,比如数据采样(如SMOTE)或者集成学习(如EasyEnsemble)的方法。数据采样中的过采样方法可能存在过拟合或边界样本分类准确率较低等问题,而欠采样方法则可能导致欠拟合。文中将SMOTE,Bagging,Boosting等算法的基本思想进行融合,提出了Rotation SMOTE算法。该算法通过在Boosting过程中根据基分类器的预测结果对少数类样本进行SMOTE来间接地增大少数类样本的权重,并借鉴Focal Loss的基本思想提出了根据基分类器预测结果直接优化AdaBoost权重更新策略的FocalBoost算法。对不同应用领域共11个不平衡数据集的多个评价指标进行实验测试,结果表明,相比于其他不平衡数据算法(包括SMOTEBoost算法和EasyEnsemble算法),Rotation SMOTE算法在所有数据集上具有最高的召回率,并且在大多数数据集上具有最佳或者次佳的G-mean以及F1Score;而相比于原始的AdaBoost,FocalBoost则在其中9个不平衡数据集上都获得了更优的性能指标。(本文来源于《计算机科学》期刊2018年07期)
于江[2](2012)在《多源分布式数据集成一体化更新策略研究》一文中研究指出本文采用基于Web Service相关技术和数据中心模式解决异构数据的集成问题。针对异构数据物理存储差异大的问题,提出基于元数据实现中心数据库和各结点资源库之间实现自适应调节的更新方法,实现对多异构系统间信息的一体化更新。该方案便于系统扩充和维护,增强了系统可扩展性、高效性和数据安全性。(本文来源于《中国科技投资》期刊2012年30期)
王发良,廖安平,朱秀丽,张宏伟[3](2012)在《海量多源1∶50000正射影像数据建库与集成更新》一文中研究指出高分辨率正射影像不仅是1∶50 000地形数据库更新的数据源,也是1∶50 000数据库更新工程的重要数据产品。本文针对国家1∶50 000更新工程DOM数据库建设目标和要求,提出了建库总体思路、技术方法和海量多源正射影像数据库的技术设计,面向正射影像数据库管理与分发服务需求研制开发了影像库集成管理与数据服务系统软件,实现影像成果数据集成管理和分发服务一体化。(本文来源于《地理信息世界》期刊2012年01期)
卢菁,朱小栋,彭敦陆,霍欢[4](2011)在《MDUAM:一个企业信息集成系统中元数据更新分析与管理系统》一文中研究指出当前的企业信息集成系统是由大量的自治系统组成,这些自治的系统的数据之间进行互操作.由于自治的系统之间可以进行互操作,因而带来了一个问题,就是对一个系统中进行的数据操作可能会给其它系统带来意想不到的影响.介绍一种方法,用于监测每一个参与互操作的系统中的元数据更新情况,对每一个数据更新可能带来的影响进行分析并加以管理.这个分析过程是通过显式地定义规则,规则分为防范性的和反应性的规则,这些规则是通用的、可扩展的,可以表达相关的数据更新的元数据.本文的方法可以在异构的环境下工作,并且能够根据特殊的需要进行定制.(本文来源于《小型微型计算机系统》期刊2011年06期)
孙博实[5](2011)在《与关系数据库无缝集成的XML数据更新引擎设计与实现》一文中研究指出随着XML成为信息表示与交换的实质标准,互联网上涌现出大量XML文档。XML文档数量与规模的与日俱增为数据库领域提出了新的课题,如何有效的管理XML数据并在此基础上支持高效的XML查询、更新机制受到了广泛的关注,成为了研究的热门。基于传统关系数据库的XML管理方案由于关系数据模型与XML数据模型本质上的差异致使其无法胜任大规模XML数据管理的工作;原生XML方案符合XML数据模型要求,但原生XML数据库的搭建需要完全重新实现经典关系数据库中已经非常成熟的诸多理论和技术,造成人力和物力上的浪费。作者所在实验室承担的国家863目标导向课题《无缝集成关系数据库引擎研制与关键技术研究》提出了一种在传统关系型数据库中无缝集成XML数据管理引擎的XML数据管理解决方案,既保持了XML数据特征,又在最大程度上重用了关系数据库的各成熟模块,取得了良好的效果。本文的主要工作是该863课题中的一个子课题:XML数据更新。基于底层存储方案,在开源关系数据库PostgreSQL中无缝集成了XML数据更新引擎。在XML更新引擎设计与实现方面的主要工作包括以下两个方面:第一,在学习W3C在XML更新领域的标准——XQuery Update Facility 1.0以及关系数据库中XML数据进行XML操作的推荐标准——SQL/XML:2003的基础上,设计符合关系数据库用户使用习惯的XML更新语法;第二,分析PostgreSQL更新执行流程,在PostgreSQL执行引擎的各个组件中无缝集成XML更新功能。此外,在对一篇符合XML模式约束(有效)的XML文档进行更新后,应保证其仍然有效。相对于传统的更新后整体验证,增量式验证方法提高了验证效率,从而提升了XML更新引擎的性能。本文在对XML元素序列模型进行了适当简化的基础上,提出了一种增量式验证的方法并在上述更新引擎中加以实现,实验表明,该方法可以有效的完成XML数据验证并且性能明显优于整体验证。(本文来源于《南开大学》期刊2011-05-01)
苟和平,景永霞,李勇[6](2010)在《信息集成系统中的缓存数据更新方案》一文中研究指出为了维护信息集成系统中的数据一致性,本文提出了一种缓存数据实时更新方案,根据信息全局模式和各个信息源输出模式之间映射关系的不同,分别采取不同的更新定位方式,实现对应全局缓存数据的实时更新,有效地解决了源数据和全局缓存数据之间的不一致问题,提高了信息查询结果的准确性.(本文来源于《佳木斯大学学报(自然科学版)》期刊2010年03期)
楼健群,陈方[7](2010)在《报刊版本记录数据自动更新的实现——以妙思~(TM)文献管理集成系统为例》一文中研究指出续订上年度已订购报刊是图书馆征订下一年度报刊时的通常做法。由于报刊的定价、出版频率等版本记录在跨年度时变动十分频繁,因而使得连续出版物系统中的相关数据也常需修改。传统的修改方法很是费时费力,而利用图书馆自动化软件的开放性和报刊版本记录信息的网络公开性,通过运行自编程序可以轻松实现连续出版物系统中版本记录数据的自动更新。(本文来源于《图书馆理论与实践》期刊2010年03期)
朱政,张启峰,王辉[8](2009)在《基于对等网的异构数据集成系统中的数据更新》一文中研究指出在基于对等网的异构数据集成系统中,部署在各个异构数据对等体上的数据库系统具有分布性、独立性和异构性,对等体间的数据需要进行交换、整合,实现信息共享,这就使数据更新成为数据集成系统的一个重要课题。由于现有的一些数据集成技术,如各种专业转换工具、联邦数据库等,都存在着灵活性差、交互性低等缺点。文中提出了将包装器和JXTA通信适配器相结合的方案,实现了异构数据对等体间数据库的信息访问、集成信息双向传输、资源的发现以及差异信息的主动式同步。(本文来源于《通信技术》期刊2009年07期)
袁晓宏,刘红军,于洪伟,张延波,殷福忠[9](2008)在《导航地理数据更新与实景影像获取集成系统研究》一文中研究指出从导航产业的关键技术分析入手,论述了导航地理数据在导航技术中的作用。在对导航地理数据采集、更新与实景影像数据获取技术的分析基础上,提出基于移动测量技术的导航地理数据采集、更新与实景影像数据获取的新技术途径,对导航地理数据与实景影像数据获取的内、外业流程和关键技术进行了论述,最后对移动测量技术在导航产业中的应用前景进行了展望。主要研究内容包括:GPS接收机、CCD相机、计算机及移动车辆等设备集成一体化,外业采集系统开发及内业数据处理系统开发等。(本文来源于《测绘科学》期刊2008年S2期)
袁晓宏,刘红军,于洪伟,张延波,殷福忠[10](2008)在《导航地理数据更新与实景影像获取集成系统研究》一文中研究指出从导航产业的关键技术分析入手,论述了导航地理数据在导航技术中的作用。在对导航地理数据采集、更新与实景影像数据获取技术的分析基础上,提出基于移动测量技术的导航地理数据采集、更新与实景影像数据获取的新技术途径,对导航地理数据与实景影像数据获取的内、外业流程和关键技术进行了论述,最后对移动测量技术在导航产业中的应用前景进行了展望。主要研究内容包括GPS接收机、CCD相机、计算机及移动车辆等设备集成一体化,外业采集系统开发及内业数据处理系统开发等。(本文来源于《测绘与空间地理信息》期刊2008年05期)
数据集成与更新论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文采用基于Web Service相关技术和数据中心模式解决异构数据的集成问题。针对异构数据物理存储差异大的问题,提出基于元数据实现中心数据库和各结点资源库之间实现自适应调节的更新方法,实现对多异构系统间信息的一体化更新。该方案便于系统扩充和维护,增强了系统可扩展性、高效性和数据安全性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据集成与更新论文参考文献
[1].陈圣灵,沈思淇,李东升.基于样本权重更新的不平衡数据集成学习方法[J].计算机科学.2018
[2].于江.多源分布式数据集成一体化更新策略研究[J].中国科技投资.2012
[3].王发良,廖安平,朱秀丽,张宏伟.海量多源1∶50000正射影像数据建库与集成更新[J].地理信息世界.2012
[4].卢菁,朱小栋,彭敦陆,霍欢.MDUAM:一个企业信息集成系统中元数据更新分析与管理系统[J].小型微型计算机系统.2011
[5].孙博实.与关系数据库无缝集成的XML数据更新引擎设计与实现[D].南开大学.2011
[6].苟和平,景永霞,李勇.信息集成系统中的缓存数据更新方案[J].佳木斯大学学报(自然科学版).2010
[7].楼健群,陈方.报刊版本记录数据自动更新的实现——以妙思~(TM)文献管理集成系统为例[J].图书馆理论与实践.2010
[8].朱政,张启峰,王辉.基于对等网的异构数据集成系统中的数据更新[J].通信技术.2009
[9].袁晓宏,刘红军,于洪伟,张延波,殷福忠.导航地理数据更新与实景影像获取集成系统研究[J].测绘科学.2008
[10].袁晓宏,刘红军,于洪伟,张延波,殷福忠.导航地理数据更新与实景影像获取集成系统研究[J].测绘与空间地理信息.2008