导读:本文包含了最小相似度论文开题报告文献综述及选题提纲参考文献,主要关键词:最小包含球,大数据,异质空间,相似度学习
最小相似度论文文献综述
董爱美,王士同,蒋亦樟,黄成泉[1](2014)在《基于最小包含球的异质空间大数据集快速相似度学习算法》一文中研究指出针对跨空间数据相似度学习问题提出的跨空间相似度学习(CSAL)算法表现出了良好的性能,并已成功地应用于各类推荐系统中.但构建一个完善的推荐系统,其待处理的数据量常呈现大样本特征,而CSAL算法并不具备大样本快速处理能力.针对此不足,提出了跨空间相似度学习-最小包含球(CSAL-MEB)方法和跨空间相似度学习-核向量机(CSAL-CVM)快速方法.CSAL-CVM方法既具有渐近线性时间复杂度和空间复杂度的优点,同时又继承了CSAL的良好性能.相关实验亦验证了所提出方法的有效性.(本文来源于《控制与决策》期刊2014年09期)
郑伟,季铎,蔡东风,王爽[2](2008)在《基于文本最小相似度的中心选取方法》一文中研究指出基于划分的聚类算法是一种局部最优算法。聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响。初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心。实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高。(本文来源于《广西师范大学学报(自然科学版)》期刊2008年03期)
付慧,刘峡壁,贾云得[3](2008)在《基于最大-最小相似度学习方法的文本提取》一文中研究指出应用最大-最小相似度(maximum-minimum similarity,简称MMS)学习方法,对基于高斯混合模型的文本区域提取方法中的有关参数进行优化.该学习方法通过最大化正样本相似度和最小化反样本相似度获得最佳分类能力.根据这种判别学习思想,建立了相应的目标函数,并利用最速梯度下降法寻找目标函数最小值,以得到文本区域提取方法的最优参数集合.文本区域提取实验结果表明:在用期望最大化(expectation maximization,简称EM)算法获得参数的极大似然估计值后,使用最大-最小相似度学习方法,使文本提取综合性能明显提高,开放实验的召回率和准确率分别达到98.55%和93.56%.在实验中,最大-最小相似度学习方法的表现还优于常用的判别学习方法——最小分类错误(minimum classification error,简称MCE)学习方法.(本文来源于《软件学报》期刊2008年03期)
向泰[4](2006)在《基于广度优先最小生成树及《知网》词汇语义相似度的启发式P2P搜索技术研究与实现》一文中研究指出P2P(Peer-to-Peer,即对等网络)是近年来广受IT业界关注的一个概念。由于广大的网络终端节点(普通用户拥有的节点,即通常意义上的终端设备)的计算和存储能力以及连接带宽随着摩尔定理不断地增长,使用P2P技术将大大提高这些节点的利用率,从而进一步提升网络、设备和信息服务的效能。目前P2P在加强网络上人的交流、文件交换、分布式计算、服务共享等方面已经充分显示出了其强大的技术优势。 目前,关于P2P技术研究的一个主要问题是搜索问题,搜索引擎技术作为互联网的叁大支撑技术之一,而P2P搜索技术作为第叁代搜索引擎技术中不可缺少的一部分,它是作为其它搜索技术的一个良性补充;同时,现阶段互连网上大量资源被闲置,没有充分的利用,P2P搜索技术可以帮助人们方便的找到各种资源,从而提高资源的利用率,实现资源的充分共享。因此,研究P2P网络的搜索技术具有重要的学术意义和实用意义。 提高任何P2P信息检索系统的速度和效率的关键就是最小化通讯量和最小化每次查询访问的对等点数量。本文阐述了P2P的一些基本概念和基础知识,包括P2P网络的定义、P2P网络与现在的C/S网络的优缺点分析。通过分析P2P网络广播消息的机制,阐述了Gnutella网络丢弃连接的必要性与可行性,本文提出了基于Prim算法的广度优先最小生成树算法(BFMST),并对算法中对等点的加入和退出、算法的复杂性和优越性、算法的不足等方面进行了详细的论述。结合P2P网络自身的特点,本文在广度优先最小生成树的基础上将《知网》的词汇语义相似度第一次引入P2P信息检索系统中,提出了基于广度优先最小生成树和《知网》词汇语义相似度的P2P启发式搜索算法和P2P对等点信息检索方法,并对算法进行了详细的阐述,给出了算法的分析和指出其中的不足。最后,作者编程模拟实现了本文提出的所有算法,给出了具体的实现步骤,通过模拟实验证明了该方法的正确性和有效性。实验表明,本文提出的广度优先最小生成树能够减少P2P网络中的回路,从而减少P2P网络中的重复消息数量,达到减少P2P网络负载的目的;另外,实验还证明了本文提出的基于《知网》词汇语义相似度的启发式P2P搜索算法比传统的启发式P2P接索算法更为合理可行,该算法的启发信息更能正确的启发未来的搜索,达到减少查询对等点数量的目的,而且使得P2P检索真正满足语义查询的需求,提高检索的效率,提高查询用户的满意程度。(本文来源于《云南师范大学》期刊2006-06-01)
最小相似度论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
基于划分的聚类算法是一种局部最优算法。聚类初始中心的选择对该聚类算法的收敛速度和聚类的性能都有很大的影响。初始中心点应该选择来自不同的类并且初始中心点文本之间的相似度应尽量小,为此提出了一种新的基于最小相似度的中心选取方法,该方法选择相似度最小的两个样本分别作为初始的两个中心,然后依次选择到已知中心相似度最小的样本作为其他类的中心。实验表明该方法能够选出来自不同类的样本作为聚类的初始中心,同其他初始中心选择方法比较,聚类算法的性能有明显提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
最小相似度论文参考文献
[1].董爱美,王士同,蒋亦樟,黄成泉.基于最小包含球的异质空间大数据集快速相似度学习算法[J].控制与决策.2014
[2].郑伟,季铎,蔡东风,王爽.基于文本最小相似度的中心选取方法[J].广西师范大学学报(自然科学版).2008
[3].付慧,刘峡壁,贾云得.基于最大-最小相似度学习方法的文本提取[J].软件学报.2008
[4].向泰.基于广度优先最小生成树及《知网》词汇语义相似度的启发式P2P搜索技术研究与实现[D].云南师范大学.2006