一、集合的基数与元素个数(论文文献综述)
郭欣彤[1](2021)在《大规模知识图谱的查询处理技术研究》文中研究指明知识图谱以结构化的形式描述客观世界中概念、实体及其之间的关系,将互联网信息表达成更接近人类认知的形式。知识图谱以其丰富的语义信息和强大的推理能力,为互联网时代的各种智能应用提供了高效的解决方案。知识图谱是人工智能的重要基石,高效地查询处理是其能够广泛应用的基础。知识图谱上的查询处理面临以下挑战:首先,知识图谱具有数据量巨大的特点,如何在分布式环境下高效地存储和索引上述大规模数据是亟待解决的问题;第二,知识图谱的查询负载多样,需要良好的划分算法在多样的负载中始终提供稳定的查询性能;第三,知识图谱既可以用关系数据模型表示,又可以用图数据模型表示,因此它天然地支持两种数据模型上的查询操作,这就需要针对不同查询的特点设计相应的查询处理算法。现有知识图谱上的查询处理技术存在种种缺陷,无法很好地解决上述问题。基于以上挑战,本文综合运用数据管理、算法学和计算复杂性的相关理论和技术,对大规模知识图谱的查询处理中的一系列重要问题进行了深入研究,主要研究成果总结如下:1.本文研究了知识图谱上的多查询优化问题。多查询优化问题是从一组查询中找出公共子查询,每个查询可以利用公共子查询的结果构建自己的结果。本文提出了一个新的多查询优化算法框架Leon。针对现有算法时间复杂度高的问题,本文提出了一个剪枝性能优越的公共子查询检测算法。它利用特征集合和triplet快速聚类相似的查询,再在每个聚簇中精确、高效地查找公共子查询。现有查询重写方法只考虑了公共子查询的结果个数,而在分布式内存环境下,计算代价和空间占用才更加重要。本文根据这两个因素定义了查询重写问题,并提出了一个近似比为ln|Q|+1的算法,|Q|代表查询个数,它总是选择代价最小的公共子查询进行重写。本文也提出了一个精巧的查询计划生成算法,它基于特征集合的基数估计方法比一般的基于谓词的方法更加准确,因此生成的计划更优。在真实数据集和生成数据集上的实验结果表明:Leon在单个查询上的效率与现有最快的基于内存的RDF查询引擎查询时间相当;引入多查询优化情形下,时间是基准方法的1/10。2.本文研究了知识图谱上的基于负载的动态划分问题。根据不断到来的查询更新底层数据划分,可以保证系统在面对复杂查询负载时总是能提供稳定的表现。本文证明了基于查询负载的动态划分问题是NP难的。现有基于负载划分的系统大多需要预先知道查询历史。本文提出了一个不需要查询历史,通过不断监测查询负载能动态更新底层数据划分的算法框架WISE。本文提出了一个新的频繁模式挖掘算法,它利用一个紧凑的数据结构query span来存储查询负载信息。为了加快query span的构建,本文提出了一个基于哈希的图同构检测算法。本文提出一个根据频繁模式生成迁移计划的算法。该算法决定移动哪些数据,以及向何处移动可以最大化迁移收益,同时每台机器上的数据量保持平衡。在多样查询负载上的实验结果表明:与其他基于负载划分的方法相比,WISE查询效率最高,能适应各种动态负载。3.本文研究了知识图谱上的正则路径查询问题。正则路径查询求解相连路径满足某个正则表达式的顶点对集合,是图上的基本查询,在金融、生物信息和社交网络中有着广泛应用。本文提出了一个能够处理正则路径查询的算法框架Leon+。现有正则路径查询处理算法大多依赖索引,索引的计算代价和空间占用巨大。因此,本文使用特征摘要图作为索引,它只需要线性的构建时间,空间占用小,主要用于查询处理时的剪枝和生成查询计划时的基数估计。为了减少查询处理时的通信代价,本文提出了一个基于特征路径的图划分算法。本文提出了一个高效、准确的两阶段查询处理算法,该算法的剪枝性能优越,可以大大减少查询响应时间。实验结果表明:Leon+在处理正则路径查询时性能优越,扩展性良好。4.本文研究了知识图谱上的多样化Top-k查询问题。在查询结果集中既考虑重要性,又考虑多样性,可以呈现给用户更有意义的结果。本文形式化定义了多样化Top-k查询问题,并证明它是NP完全的。现有算法时间复杂度为O(1/2kn2),近似比为2,其中n代表结果个数。本文提出了一个近似比为2,时间复杂度为O(kn)的算法DTopk-Base。为了进一步降低时间开销,本文提出了一种高效的启发式算法DTopk-Index,选择性地生成高质量结果。DTopk-Index的近似比上界为2/λ,其中λ ∈[0,1]是平衡重要性和多样性的系数。在真实和生成数据集上的实验结果显示:两个算法都能够高效地生成高质量结果集合。案例分析也说明了在查询结果中引入重要性和多样性可以提高用户满意度。
路帆[2](2021)在《几类序列的伪随机性证明》文中进行了进一步梳理在数论中,解析数论是以解析的方法作为研究工具的一个数论分支,它以解析的方法让一些困难的问题迎刃而解。例如,初等数论中同余方程的相关问题可以转化为求解析数论中特征和的上界。随着大数据时代的发展,数论中的一些理论被广泛地应用到了信息安全等领域。在密码学中,有些密钥伪随机性的证明往往等价于证明其对应序列的均匀分布性,均匀分布性又可以转化为证明解析数论中特征和或者指数和的上界得到。因此,许多问题都和指数和、特征和有着极其密切的关系。本文在同余理论的基础上利用特征和的性质以及偏差、统计接近均匀分布等方法证明了密码序列的均匀分布性,从而保证其密码算法的安全性。并且借助特征和的性质研究了一类特殊同余方程的相关问题。主要研究内容和结果如下:(1)利用特征和的性质以及概率论中统计接近的方法研究了一类以基数g展开式中乘积数的伪随机性,即证明x1x2(modp)的均匀分布性质。x1,x2取自集合FD(r)={ 0≤n<gr|aj(n)∈ D,0<j ≤r-1}时,我们得到x1x2(modp)的均匀分布性。进一步,将乘积推广到更一般的形式,即证明x1x2…xm(mod p)的分布。这里xj为以g权展开式中分布重量值为s的数时,得到了关于其均匀分布性的相应结论。当g=2时应用此方法证明了低汉明重量序列的伪随机性。这表明了权展开式序列以及低汉明重量序列在密码算法中所要求的不可预测性和安全性。(2)利用特征和的上界估计研究了一类椭圆曲线序列的均匀分布,即对Tanja Lange[1]等人提出的均匀分布测度的上界进行改进,更进一步说明了该伪随机序列的良性分布性质。(3)作为Golomb-Lehmer问题的拓展,利用特征和的性质得到了两类同余方程解个数的上界估计,并且将其个数在一个小的子群和短区间内估计出来。
李固冲[3](2021)在《时间异步和非同视域条件下的分布式融合算法研究》文中指出在分布式传感器网络中,每个节点通过与临近节点交换多目标后验分布并联合所有临近节点的信息进行融合。但分布式传感器网络中的节点因功能、配置时钟、探测范围等特性的差异,导致节点间往往无法在相同视域内的同一时间点探测到相同的目标信息,造成基于广义协方差交叉(GCI)和加权算术平均(WAA)准则的分布式融合算法失效。能否保证待融合信息所表征的目标信息一致,是保证时间异步和非同视域条件下的分布式融合算法有效的关键。本文围绕时间异步和非同视域条件下的分布式融合算法所面临的多采样率、存在时钟偏置、视域不同、视域信息未知等问题,进行了问题分析、方法研究、仿真实验等系统性工作,主要研究内容包括:1.针对时间异步条件下的分布式融合问题,提出了GCI准则下基于时戳差值(TD)的分布式融合算法(TD-GCI),可在多采样率的时间异步场景中,利用时戳信息和C-K方程实现节点间后验分布的时间校准,保证了GCI融合算法的有效性;提出了GCI准则下基于时间偏置估计(TE)的分布式融合算法(TE-GCI),可在存在时钟偏置和未知传输时延的时间异步场景中,利用随机采样或多时钟假设方法估计出后验分布之间的时间偏置,保证了时间校准过程的有效性。2.针对非同视域条件下的分布式融合问题,提出了GCI准则下基于强度分解(ID)的概率假设密度(PHD)滤波器的分布式融合算法(ID-GCI-PHD),可在视域信息未知的非同视域场景中,实现子强度函数间的匹配与融合,提高了GCI-PHD融合算法在目标漏检发生时的跟踪性能;提出了WAA准则下基于视域信息的ID-WAA-PHD分布式融合算法(FID-WAA-PHD),提高了在视域信息可靠已知且时不变的非同视域场景中的目标基数估计的精度;提出了基于聚类方法实现的ID-WAA-PHD分布式融合算法(CID-WAA-PHD),避免了在视域信息不可靠或未知的非同视域场景中由不可靠视域信息造成的错误空间划分。3.针对时间异步且非同视域条件下的分布式融合问题,提出了WAA准则下异步的基于聚类方法实现的ID-WAA-PHD分布式融合算法(ACID-WAA-PHD),同时实现时间校准和自适应空间划分,拓展了WAA-PHD融合算法的应用范围。
李东林[4](2020)在《RFID系统中的一种高效持续扫描协议》文中提出射频模式识别(RFID)技术广泛应用于仓储管理、物流管理等很多领域。持续扫描是RFID技术的一个重要应用。当RFID标签的分布范围较大时,阅读器不能在一个位置收集所有标签ID。持续扫描协议使阅读器能够高效快速的在不同位置收集所有标签的ID。当前已有的持续扫描协议存在误判率较高的问题。为了降低误判率,本文设计了一种数据结构ONV,ONV由多个Bloom Filter数组复合得到。将多个Bloom Filter数组压缩为一个序号向量ONV,可以显着降低需要传输的数据量。本文提出了一种利用ONV向量灭活已知标签的算法,并将这种算法称为ONV算法。后台服务器首先生成一个ONV向量,然后通过阅读器将ONV向量发送给标签。标签使用ONV向量判断自己是否为已知标签,如果标签判断自己是已知标签,则会被灭活。ONV算法能够高效地灭活已知标签,且该算法的通信开销和误判率都比较小。基于ONV算法,本文提出了一种基于序号向量的持续扫描协议OCS(ONV-based Continuous Scanning protocol)。OCS首先计算出一个比值,然后根据比值的大小,从两种ID收集算法中选择时间开销小的算法。如果比值小于等于1,则OCS使用现有的CA算法直接收集所有活跃标签的ID。如果比值大于1,则OCS先用ONV算法灭活已知标签,然后用现有的CA算法收集未知标签的ID。为了评价OCS的性能,本文将时间开销和误判率作为评价指标进行实验,并与现有的持续扫描协议进行对比。实验结果表明,OCS的时间开销和误判率较小,有良好的性能表现。
刘荣鑫[5](2020)在《面向数据集覆盖问题的优化算法研究》文中研究指明在数据科学时代,基于某些数据集训练学习算法是常见的。通过调查或科学实验,我们可以前瞻性地收集到数据集。最近,已经认识到训练数据集只是具有代表性是不够的,如果受训练的系统要很好地处理一些不太流行的类别,则必须包括来自这些类别的足够的例子,这便是数据集覆盖问题。数据集覆盖问题和不平衡学习问题不同,直接利用不平衡学习的方法可能无法很好的处理这类问题。于是有人提出了极大未覆盖模式(Maximal Uncovered Pattern(MUP))的概念;在此基础上已经有了三种获取MUP的算法,分别是自顶向下的算法(Pattern-Breaker)、自底向上的算法(Pattern-Combiner)以及Deep Diver算法;接着提出了如何根据需要考虑的MUP来搜索尽可能少的数据元组,达到解决缺乏覆盖问题的基于贪心策略的近似算法。但是现有的方法依然存在可以优化改进的地方。在前述研究基础上,本论文主要研究以下内容:(1)研究分析了已有获取MUP的三种算法的优缺点以及适用场景,研究分析了获取MUP算法和频繁项集挖掘的区别和联系;(2)结合关联规则挖掘中相关研究以及搜索算法的思路,研究并提出了针对Deep Diver算法的改进算法Fast Deep Diver算法,它能够更快地识别到未覆盖模式并更快地获取MUP,从而过滤掉更多的节点;(3)提出了计算coverage算法面对数据稀疏问题以及位图过大内存不足问题的解决思路;(4)面对如果使用已有的基于贪心思想的近似算法得到的需要获取的数据元组,但是这样的数据元组我们很难在现实生活中收集到的情况,我们提出了一种基于模式位图的匹配算法,用于处理这种情况。本论文通过对三个数据集的实验,验证了缺乏覆盖问题产生的影响,同时通过实验对比了各个获取MUP算法在各个场景下的性能,分析了它们的优缺点和适用场景,并验证了Fast Deep Diver算法相对于Deep Diver算法的优越性,Fast Deep Diver算法在大多数情况下运行性能比Deep Diver算法高,具有更好的稳定性。
陈娜[6](2020)在《关于有限集合组合学的若干研究》文中进行了进一步梳理我们研究有限集的交族问题:当对[n]元集([n]={1,2,3,...,n})的子集族的交、对子集族中的子集所含元素个数进行限制或者将两者同时进行限制时,考虑该子集族所含子集个数的上界。也就是研究满足所给条件的子集族的最大基数问题。本文结合有限集交族中现有的一些组合对象和组合结论,利用多项式空间的方法,研究非模情形和模p情形下的特定的有限集L-交族以及特定的交叉交族问题,并且在Hunter Snevily,陈永川,刘九强以及Rudy XJ Liu等人的相关研究结果的基础上做进一步的推广。首先,用多项式空间的方法对模pL-交的子集族F分别满足:(1)K∩L=(?),∩Fi∈F Fi≠(?),min ki>s-r;(2)min ki>max lj,n ≥s+max ki时的最大基数给出详细证明。其次,用该方法证明并得出关于特定交叉交族的两个结论:(1)模p情形下,满足min{|Ai|(modp)|1 ≤i ≤m}>max lj,n≥s+maxki时,子集族A或B所含子集的最大基数;(2)非模情形下,满足{|Ai||1≤i≤m}为r个连续整数,k1>s-r,max lj<min{|Ai||1 ≤i≤m}时,子集族A或B所含子集的最大基数。最后,给出非模情形下,L-交的子集族F在满足:min ki>max lj,∩Fi∈FFi≠(?)时的最大基数,得到定理4.2,并利用定理4.1的结论对定理4.2进行证明。
李莉[7](2020)在《56岁儿童数学问题解决认知诊断评估工具的开发及应用研究》文中研究指明数学问题解决是学前数学教育质量监测与评估中较为重要的内容,但相关的研究却比较薄弱。为了接轨国际儿童早期数学学习与评估的价值导向,更好地衔接小学数学课程目标,落实从数学问题解决的视角监测学前儿童的数学学习与发展,以及从微观知识结构入手真正促进儿童数学学习的发展,本研究以56岁儿童为研究对象,以“数与运算”领域的问题解决为研究内容,尝试应用认知诊断理论与技术开发56岁儿童“数与运算”问题解决的认知诊断评估工具,并使用此工具开展认知诊断评估,以及基于认知诊断评估结果开展教育干预研究。研究一:开发《56岁儿童“数与运算”问题解决认知诊断测验》(简称CDTMPS测验)。首先,构建56岁儿童“数与运算”问题解决的认知模型。该认知模型包括数学知识与技能、语义理解和数量推理3个认知成分以及下属的11个认知属性:基数概念、集合比较、10以内加减运算;合并型语义理解、结果未知型变化语义理解、变化未知型变化语义理解、一致型比较语义理解、非一致型比较语义理解;加减逆反推理、加法组合推理和一对多推理。其次,开发CDT-MPS测验。质量检验的结果表明,本研究构建的认知模型较为科学合理,CDT-MPS测验(正式版)具有良好的信度和效度,包含35道题,采用一对一口头测查及0-1计分,测试时间在30分钟左右。研究二:56岁儿童“数与运算”问题解决的认知诊断评估。考查56岁儿童“数与运算”问题解决的发展状况,了解CDT-MPS测验作为学前儿童数学教育监测评估工具的价值。第一,以上海、湖南和河南三个地区13所城乡幼儿园的680名大班儿童为被试,开展认知诊断评估的横向研究。结果表明:三个地区样本儿童的整体数学问题解决能力均处于中等水平,对数学知识与技能的掌握好于对语义理解及数量推理的掌握;虽然三个地区城市样本儿童的整体数学问题解决能力不存在显着差异,湖南和河南地区城乡和农村样本儿童以及不同性别和不同等级幼儿园儿童的整体数学问题解决能力存在显着差异,但不同地区、城乡、性别和园所等级的样本儿童对11个认知属性的掌握均存在各自的优势和不足。第二,以上海地区4所幼儿园的245名大班儿童为被试,开展认知诊断评估的跟踪研究。分别在大班上学期和下学期进行两次CDT-MPS测试,间隔为7个月。结果表明:样本儿童的整体数学问题解决能力有显着提升,但对11个认知属性的掌握进步速度各不相同;一级幼儿园和二级幼儿园样本儿童的进步不存在显着差异;男孩的进步显着大于女孩。研究三:基于认知诊断评估结果开展教育干预研究。被试来自上海市同一所幼儿园两所大班的60名儿童,分为10以内加减运算、变化语义理解、加减逆反推理、加法组合推理和一对多推理五种干预,每种干预12名被试。以小组干预和个别干预相结合的方法,每种干预每周干预1次(每次3040分钟),共8次。结果表明:变化语义理解和加法组合推理两组的干预有显着效果;五种干预既有其各自有所需的不同核心经验,也有共同所需的基本数学技能及干预措施。综上,应用认知诊断评估开发学前数学领域的评估工具有其优势及难度,本研究为今后的应用研究提供了经验;本研究开发的CDT-MPS测验可以为学前数学教育质量监测提供丰富的信息,有助于教育行政机构从微观层面了解不同地区不同园所数学教育的优势与不足;本研究为今后开展基于认知诊断评估结果的教育干预研究提供了一定的经验和思考,但仍面临较大的挑战,需要更多的探索。
李国良,周煊赫,孙佶,余翔,袁海涛,刘佳斌,韩越[8](2020)在《基于机器学习的数据库技术综述》文中认为大数据时代下,面对不断膨胀的数据信息、复杂多样的应用场景、异构的硬件架构和参差不齐的用户使用水平,传统数据库技术很难适应这些新的场景和变化.机器学习技术因其较强的学习能力,逐渐在数据库领域展现出了潜力和应用前景.论文首先给出一个高效、高可靠、高可用、自适应性强的数据库系统需要涵盖的方面,包括数据库运维、数据存储、查询优化等.其次,讨论机器学习算法与数据库技术结合过程中可能面临的挑战,包括训练数据少、训练时间长、泛化能力有限、适应性差四个方面.然后,综述数据库技术与机器学习结合的现状以及具体技术.其中,重点介绍数据库自动调参、查询基数估计、查询计划选择、索引和视图自动选择五个方向.自动调参技术包括启发式算法、传统机器学习、深度强化学习三类.启发式算法从离散的参数空间中通过抽样探索最优子空间,可以有效提高调参效率,但是难以保证在有效资源限制内找到合适配置;传统机器学习算法在经过降维的参数空间中学习系统状态到指定负载模板的映射关系,一定程度上提升模型的适应性;深度强化学习在高维参数空间中迭代的学习调优策略,并利用神经网络提升对高维数据的处理能力,有效降低训练数据的需求.查询基数估计包括面向查询和面向执行计划两类.面向查询方法利用卷积神经网络学习表数据、查询条件、连接条件之间的关系,然而在不同场景下需要大量训练而且泛化能力差;面向执行计划方法在物理算子层面做级联的代价估计,一定程度上提高对不同查询的适应能力.查询计划选择包括深度学习和强化学习两类.深度学习方法融合数据库估计器的代价值和数据特征,提高对每种计划代价估计的精度,但是结果严重依赖估计器的表现;强化学习基于最终目标迭代生成查询计划,降低方法对查询代价的依赖性.自动索引推荐包括分类器、强化学习、遗传算法三类.分类算法根据离散的表特征分析不同索引的创建开销和效率,通过结合遗传算法,提高对复合索引的推荐效率;强化学习进一步提供增量式索引推荐的效率,实现在线索引选择.自动视图选择包括启发式算法、概率统计、强化学习三类.启发式算法通过在视图构建的有向无环图上做贪心探索,提高选择效率,然而适应性差;基于概率统计的算法将视图选择形式化成一个0-1选择问题,有效降低图的探索开销;强化学习方法将视图的创建和删除统一成动态选择过程,基于强化学习的训练策略进一步提高选择效率.最后,从八个方面展望机器学习将给数据库带来的革命性突破.
徐杰[9](2019)在《高速网络访问超点检测算法研究》文中进行了进一步梳理访问超点是网络中在一段时间内与远大于平均值数量的对端有交互行为的主机。访问超点检测算法的目标就是找出流量中连接对端数大于阈值的所有主机。访问超点一般是服务器、代理、扫描器和被DDoS攻击的主机。访问超点检测对网络安全和网络管理有重要的意义,也是这个领域一个没有完全解决的热点问题。现有访问超点检测算法存在如下缺陷:算法运行时间长,无法实时处理高速网络数据;不能在滑动时间窗口下运行,无法检测跨越时间窗口边界的访问超点;分布式环境下通信开销大等。本文针对上述三个问题分别进行了研究。本文将GPU(Graphics Processing Unit)并行计算方法引入了访问超点检测的研究领域,解决了访问超点检测的实时性问题。基于Bernstein条件等并行计算的相关基础理论,给出了一组用于判定访问超点检测算法是否能在GPU环境中并行运行的条件,并提出了一个基于GPU的通用访问超点检测框架。利用该框架,将三个现有的符合条件的访问超点检测算法移植到了三个不同性能的GPU平台上,并基于10Gb/s和40Gb/s带宽的实测流量进行了测试。实验结果表明,对于符合条件的访问超点检测算法,GPU通用访问超点检测框架不仅能保证估算准确率与CPU环境下相同,而且有效运行时间只有CPU平台上有效运行时间的1/50到1/2050。滑动时间窗口下的访问超点检测需要解决检测次数频繁、增量式更新主数据结构和快速的主数据结构状态维护三个挑战。本文提出了用模糊估值器和滑动时间窗口下的计数器相结合的方法解决了上述问题。本论文首次提出了将模糊估值器(Rough Estimator,RE)引入访问超点检测算法的研究思路。具体的方法是基于统计学领域经典的基数模糊估值算法,提出一种面向IPv4地址的轻量级估值器,用其对海量的原始流量数据进行筛选,从而大大减少了估值的压力。论文证明了在常规参数下,用RE进行访问超点筛选的准确率超过99.9%。距离计数器(Distance Recorder,DR)是本文提出的一种能在滑动时间窗口下增量式更新且内存最优的计数器。在设计了模糊估值器和距离计数器所有相关细节的基础上,本文提出了一个滑动时间窗口下的实时访问超点检测算法-滑动模糊线性算法(Sliding Roughand Linear Algorithm,SRLA)。SRLA 算法将 RE 作为初筛工具,在处理网络数据流的同时,在线生成候选访问超点列表。由于初筛环节大大减少了估算对象的数量,所以在估算环节,SRLA算法使用了一种高精度的估值器,线性估值器(Linear Estimator,LE),能够更加准确地估算出候选列表中各主机的连接对端数。实验表明,对1 OGb/s和40Gb/s的高速网络,在离散时间窗口下,SRLA算法的错误率接近于现有算法,但估算访问超点的时间平均只有现有算法的1/520。估算访问超点时间的降低,使得SRLA在需要进行频繁检测的滑动时间窗口下运行成为可能。通过将RE和LE与DR结合,SRLA算法实现了在滑动时间窗口下对主数据结构增量式地更新。在10Gb/s和40Gb/s实测流量条件下,SRLA算法能在时间窗口为300秒,滑动步长为1秒的条件下支持实时访问超点检测。针对SRLA算法在DR数量增多时对DR进行状态维护的时间瓶颈问题,本论文提出了一种低状态维护时间的计数器,异步时间戳计数器(Asynchronous Timestamp,AT)。AT比DR多占用一个比特的内存。对于具有k个时间片的滑动时间窗口,维护AT状态的时间复杂度只有O(1/k),而维护DR状态的时间复杂度为O(1)。基于AT,本文提出了一种滑动时间窗口下低状态维护时间的连接对端数估算算法-虚拟异步时间戳估计器(Virtual Asynchronous Timestamp Estimator,VATE)。实验表明,当 AT 个数越多时,VATE估算准确率越高。当AT个数达到232时,VATE在每个时间片里维护所有AT状态的时间不超过2.6毫秒,小于维护同等数量的DR所用时间的1/400。用AT替换SRLA算法里的DR,可以进一步降低SRLA算法的运行时间。在分布式环境下,数据汇聚会占用大量带宽或造成流量尖峰。为了降低分布式环境下的通信开销,本论文设计了一个三阶段托付的分布式访问超点检测算法-基于模糊估值器的分布式异步访问超点检测算法(Rough Estimator based Asynchronous Distributed algorithm,READ)。READ算法利用RE在分布式环境下生成候选访问超点。READ算法仅向全局服务器传递与候选访问超点相关的数据,而不是全部主数据结构,从而降低了通信开销。本文从理论上证明了 READ算法在分布式环境下的错误率不高于汇聚检测数据条件下的错误率。实验表明,对1OGb/s和40Gb/s的高速网络数据,READ算法可以将通信量减少95%以上。本博士论文从各种不同的角度对高速网络访问超点检测算法进行了深入细致地研究。利用本文的研究成果,可以实现滑动时间窗口下高速网络的实时访问超点检测,以及在分布式环境下高效快速的访问超点检测。
韩辉[10](2019)在《等级调制码的构造方法研究》文中提出随着NAND闪存芯片存储密度的提高,数据存储的可靠性已经成为大容量闪速存储系统研究及应用面临的重要问题。等级调制方案利用单元间电荷值的相对等级所形成的置换而不是单元电荷绝对值来表示数据,可以避免闪存单元的过度编程问题,并且降低闪存中非对称错误的影响。基于等级调制方案的置换码(Permutation code)和多重置换码(Multi-Permutation code)能够缓解闪存的过度编程和电荷泄露等问题。因此,等级调制纠错码的构造及其相关译码方法的研究近年来受到了学者们的广泛关注。本文对基于等级调制方案的置换码和多重置换的构造方法进行了深入的研究,主要研究成果概括如下:1.闪存单元发生的“强度有限错误”可以利用切比雪夫距离度量来描述。针对切比雪夫距离度量下可以纠正“强度有限错误”的(7)k(10)n,k!,d(8)系统置换码缺乏编译码方法的问题,通过利用置换的ranking映射和切比雪夫距离度量下(n,M,d)置换码的交织技术,提出了该系统置换码的一种编码方法。同时,借助置换的unranking映射和切比雪夫距离度量下(n,M,d)置换码中置换投影技术,提出了该系统置换码的一种译码方法。最后,通过计算实例验证了所提出系统置换码的编码和译码方法的正确性。2.通过构造一个子群码并利用其右陪集来划分系统码的信息置换集合,提出了切比雪夫距离度量下(7)k(10)n,k!,d(8)系统置换码的一种新的构造方法。与现有系统置换码相比较,所提出系统置换码可以获得更大的码字个数,从而达到更大的码率。为了便于所构造的系统置换码的编译码,研究了针对置换的ranking映射和unranking映射概念。同时,将这两个概念推广到针对多重置换的Mranking映射与Munranking映射。基于这些映射,提出了切比雪夫距离度量下(7)k(10)n,k!,d(8)系统置换码的编译码方法。而且,给出了具体的例子进行说明所提出编译码方法的正确性。3.针对闪存中等级调制码的单个长度至多为t的“符号不变删除(Symbol-Invariant Deletion,SID)”错误问题,通过利用置换的交织技术,提出了可以纠正长度最多为t的单个突发符号不变删除(SID)错误的两类置换码的构造方法。同时,提出了可以纠正长度最多为t的单个突发符号不变删除(SID)错误的平衡多重置换码的构造方法。而且,关于三类构造的定理证明中包含了这些码的译码方法。同时,给出了具体的例子进行说明所构造几类码译码的正确性。4.针对闪存中多重置换码的单个“突发不稳定擦除(Burst Unstable Erasure,BUE)错误问题,提出了闪存单元状态的一个新的等级解调方法,其目的是将一个t-平衡多重置换的单个突发不稳定擦除错误(BUE)转化为t个置换中“置换不变擦除(Permutation-Invariant Erasure,PIE)”错误的问题。基于该等级解调方法,通过交织t个纠单个PIE错误置换码,提出了可以纠长度至多为t的单个BUE错误的两类t-平衡多重置换码的构造方法。关于两类构造方法的定理证明中包含了这些码的译码方法。同时,给出了相应实例来验证相关译码方法的正确性。
二、集合的基数与元素个数(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、集合的基数与元素个数(论文提纲范文)
(1)大规模知识图谱的查询处理技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 知识图谱的表示模型和查询语言 |
1.2.2 关键术语 |
1.2.3 知识图谱的数据管理 |
1.2.4 分布式环境下知识图谱的数据管理 |
1.2.5 知识图谱的多查询优化工作 |
1.2.6 知识图谱的划分算法工作 |
1.2.7 知识图谱的正则路径查询工作 |
1.2.8 知识图谱的多样化Top-k查询工作 |
1.2.9 现有工作不足 |
1.3 本文的主要研究内容 |
1.3.1 大规模知识图谱的多查询优化技术 |
1.3.2 大规模知识图谱的基于负载的动态划分问题 |
1.3.3 大规模知识图谱的正则路径查询问题 |
1.3.4 大规模知识图谱的多样化Top-k查询问题 |
1.3.5 研究内容之间的关系 |
1.4 RDF查询系统的通用结构 |
1.5 本文的章节安排 |
第2章 知识图谱的多查询优化技术 |
2.1 研究动机 |
2.2 预备知识 |
2.3 编码和划分算法 |
2.3.1 特征集合和特征集合块 |
2.3.2 RDF编码和特征集合提取 |
2.3.3 基于特征集合的平衡划分算法 |
2.3.4 Leon中的基本操作 |
2.3.5 特征集合块的优点 |
2.4 公共子结构检测 |
2.4.1 SPARQL查询分解和粗粒度聚类 |
2.4.2 查找公共子结构 |
2.4.3 公共子查询检测算法实现 |
2.4.4 算法分析 |
2.5 查询重写算法 |
2.5.1 基本思路 |
2.5.2 算法分析 |
2.5.3 代价估计模型 |
2.6 实验结果 |
2.6.1 实验设置 |
2.6.2 启动时间 |
2.6.3 单查询性能表现 |
2.6.4 多查询优化的性能表现 |
2.6.5 可扩展性 |
2.7 本章小结 |
第3章 知识图谱的基于负载的动态划分问题 |
3.1 研究动机 |
3.2 WISE工作流程 |
3.3 SPARQL查询负载编码 |
3.3.1 查询预处理 |
3.3.2 频繁查询模式 |
3.3.3 Query Span |
3.3.4 Query Span的构建 |
3.3.5 算法分析 |
3.4 WISE的迁移管理 |
3.4.1 频繁模式挖掘 |
3.4.2 迁移计划生成 |
3.4.3 三元组迁移 |
3.4.4 查询负载改变时的应对策略 |
3.4.5 动态RDF数据集的应对策略 |
3.5 Query Span的扩展 |
3.5.1 谓词为变量的查询 |
3.5.2 顶点常量编码 |
3.6 实验结果 |
3.6.1 实验设置 |
3.6.2 Query Span的构建 |
3.6.3 与其他方法的比较 |
3.6.4 查询负载的影响 |
3.6.5 迁移代价 |
3.7 本章小结 |
第4章 知识图谱的正则路径查询问题 |
4.1 研究动机 |
4.2 预备知识 |
4.3 索引和摘要策略 |
4.3.1 特征集合和特征集合块 |
4.3.2 特征摘要图 |
4.3.3 特征摘要图的实现 |
4.3.4 特征摘要图的更新 |
4.4 基于特征路径的平衡划分算法 |
4.4.1 特征路径 |
4.4.2 特征路径划分模型 |
4.4.3 算法分析 |
4.4.4 从节点索引结构 |
4.5 正则路径查询处理算法 |
4.5.1 特征摘要图遍历 |
4.5.2 算法分析 |
4.5.3 在生成子图上进行查询处理 |
4.6 代价估计模型 |
4.6.1 基数估计 |
4.6.2 查询计划生成 |
4.7 实验结果 |
4.7.1 实验设置 |
4.7.2 特征路径的参数选择 |
4.7.3 预处理代价 |
4.7.4 正则路径查询的性能表现 |
4.7.5 特征摘要图对查询计划的影响 |
4.7.6 基于特征路径的划分算法对查询性能的影响 |
4.7.7 可扩展性测试 |
4.8 本章小结 |
第5章 知识图谱的多样化Top-k查询问题 |
5.1 研究动机 |
5.2 问题定义 |
5.2.1 RDF和 SPARQL |
5.2.2 多样化Top-k查询问题 |
5.3 DTopk-Base算法 |
5.3.1 算法描述 |
5.3.2 算法分析 |
5.4 DTopk-Index算法 |
5.4.1 第一阶段 |
5.4.2 第一阶段算法分析 |
5.4.3 第二阶段 |
5.5 多样性匹配生成算法 |
5.5.1 骨干索引 |
5.5.2 运行时的骨干索引 |
5.5.3 Find Match函数实现 |
5.6 实验结果 |
5.6.1 实验设置 |
5.6.2 骨干索引 |
5.6.3 有效性实验 |
5.6.4 效率实验 |
5.6.5 案例分析 |
5.7 本章小结 |
结论 |
参考文献 |
附录A 第4章用到的查询 |
A.1 LUBM的正则路径查询 |
A.2 YAGO2的正则路径查询 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)几类序列的伪随机性证明(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 主要成果及内容组织 |
2 一类以基数g展开式乘积的伪随机性 |
2.1 引言及结论 |
2.2 相关定义和引理 |
2.3 定理的证明 |
2.4 本章小结 |
3 一类椭圆曲线序列的伪随机性 |
3.1 引言及结论 |
3.2 相关定义及引理 |
3.3 定理的证明 |
3.4 本章小结 |
4 Golomb- Lehmer问题及其拓展 |
4.1 引言及结论 |
4.2 相关定义和引理 |
4.3 定理的证明 |
4.4 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
攻读学位期间主要研究成果 |
(3)时间异步和非同视域条件下的分布式融合算法研究(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 经典的分布式融合算法 |
1.2.2 时间异步条件下的分布式融合算法 |
1.2.3 非同视域条件下的分布式融合算法 |
1.3 本文的结构安排 |
第二章 基于多目标矩近似滤波器的分布式融合算法 |
2.1 多目标矩近似滤波器理论基础 |
2.1.1 随机有限集的定义 |
2.1.2 多目标概率密度函数 |
2.1.3 常见的多目标后验分布 |
2.2 多目标矩近似滤波器 |
2.2.1 概率假设密度滤波器 |
2.2.2 基数概率假设密度滤波器 |
2.2.3 跟踪性能评价指标 |
2.3 分布式融合准则 |
2.3.1 广义协方差交叉准则 |
2.3.2 加权算术平均准则 |
2.4 本章小结 |
第三章 时间异步条件下基于GCI准则的分布式融合算法 |
3.1 TD-GCI分布式融合算法 |
3.1.1 问题分析 |
3.1.2 算法描述 |
3.1.3 算法实现 |
3.1.4 性能分析 |
3.2 TE-GCI分布式融合算法 |
3.2.1 问题分析 |
3.2.2 算法描述 |
3.2.3 算法实现 |
3.2.4 性能分析 |
3.3 本章小结 |
第四章 非同视域条件下基于PHD滤波器的分布式融合算法 |
4.1 ID-GCI-PHD分布式融合算法 |
4.1.1 问题分析 |
4.1.2 算法描述 |
4.1.3 算法实现 |
4.1.4 性能分析 |
4.2 ID-WAA-PHD分布式融合算法 |
4.2.1 问题分析 |
4.2.2 算法描述 |
4.2.3 基于视域信息的算法实现 |
4.2.4 基于聚类方法的算法实现 |
4.2.5 性能分析 |
4.3 本章小结 |
第五章 联合时间异步和非同视域条件下WAA-PHD融合算法 |
5.1 问题分析 |
5.2 ACID-WAA-PHD分布式融合算法 |
5.2.1 算法描述 |
5.2.2 近似误差分析 |
5.3 性能分析 |
5.3.1 仿真场景设置 |
5.3.2 仿真结果与分析 |
5.4 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 后续工作展望 |
致谢 |
参考文献 |
附录A 第四章公式证明 |
A.1 定理4.1.1 的证明 |
A.2 定理4.2.1 的证明 |
A.3 定理4.2.2 的证明 |
附录B 第五章公式证明 |
B.1 定理5.2.1 的证明 |
B.2 定理5.2.2 的证明 |
攻读博士学位期间取得的成果 |
(4)RFID系统中的一种高效持续扫描协议(论文提纲范文)
摘要 |
Abstract |
符号说明表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 研究内容与论文结构 |
1.3.1 研究内容 |
1.3.2 论文结构 |
1.4 本章小结 |
2 相关技术和相关协议 |
2.1 相关技术 |
2.1.1 哈希函数 |
2.1.2 时隙ALOHA协议 |
2.1.3 Bloom Filter |
2.2 相关协议 |
2.2.1 CU协议 |
2.2.2 ACOS协议 |
2.2.3 ZOE协议 |
2.3 本章小结 |
3 OCS协议 |
3.1 系统模型与问题定义 |
3.1.1 系统模型 |
3.1.2 问题定义 |
3.2 协议设计 |
3.2.1 整体流程 |
3.2.2 ONV算法具体执行过程 |
3.2.3 ONV算法的参数和时间开销 |
3.2.4 ID收集算法的选择 |
3.3 协议分析 |
3.3.1 时间复杂度分析 |
3.3.2 空间复杂度分析 |
3.4 本章小结 |
4 实验与分析 |
4.1 系统参数设置 |
4.2 评估指标 |
4.3 实验结果 |
4.4 对比实验 |
4.5 本章小结 |
结论 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
(5)面向数据集覆盖问题的优化算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景及研究意义 |
1.2 国内外研究现状及分析 |
1.3 论文的主要研究内容和结构安排 |
1.3.1 论文的主要研究内容 |
1.3.2 论文的结构安排 |
第2章 数据集覆盖问题相关定义及基本方法 |
2.1 数据集覆盖问题相关定义 |
2.2 MUP识别问题—获取MUP的 Naive算法 |
2.3 处理数据集覆盖问题的方法—Coverage Enhancement |
2.3.1 原问题转换为Hitting set问题 |
2.3.2 基于贪心思想的近似算法 |
2.4 本章小结 |
第3章 数据集覆盖问题相关算法研究与优化 |
3.1 获取MUP算法与频繁项集挖掘的区别和联系分析 |
3.2 对现有获取MUP算法的分析与研究 |
3.2.1 自顶向下算法(Pattern-Breaker)分析 |
3.2.2 自底向上算法(Pattern-Combiner)分析 |
3.2.3 Deep Diver算法分析 |
3.3 获取MUP的改进算法—Fast Deep Diver算法 |
3.4 计算coverage算法的改进方法 |
3.5 基于模式位图的匹配算法 |
3.6 本章小结 |
第4章 算法结果及分析 |
4.1 数据集与实验运行环境 |
4.1.1 实验数据集介绍 |
4.1.2 实验运行环境介绍 |
4.2 验证缺乏覆盖问题的影响实验 |
4.2.1 真实数据集中存在的缺乏覆盖问题 |
4.2.2 缺乏覆盖的影响及添加数据元组进行覆盖的效果 |
4.3 获取MUP算法性能比较实验 |
4.3.1 只改变阈值性能比较 |
4.3.2 只改变数据元组个数性能比较 |
4.3.3 只改变属性个数性能比较 |
4.4 本章小结 |
结论 |
参考文献 |
攻读硕士学位期间发表的论文及其它成果 |
致谢 |
(6)关于有限集合组合学的若干研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及其意义 |
1.2 国内外研究现状 |
1.3 预备知识 |
1.4 本文研究思路 |
1.5 本文结构 |
第2章 模p情形下的特定有限集L-交族 |
2.1 满足K∩L=(?),∩F_i∈F~(F_i)≠(?),min k_i>s-r的模p L-交族 |
2.2 满足min k_i>max l_j,n≥s+max k_i的模p L-交族 |
2.3 本章小结 |
第3章 非模情形及模p情形下的特定交叉交族 |
max l_j,n≥s+max k_i的交叉交族'>3.1 满足min{|A_i|(modp)}>max l_j,n≥s+max k_i的交叉交族 |
max l_j,{|A_i||1≤i≤m}为r个连续整数的交叉交族'>3.2 满足min{|A_i|}>max l_j,{|A_i||1≤i≤m}为r个连续整数的交叉交族 |
3.3 本章小结 |
第4章 非模情形下的特定有限集L-交族 |
4.1 满足min k_i>max l_j,∩F_i∈F~(F_i)≠θ的L-交族 |
4.2 本章小结 |
结论 |
1 文章结论 |
2 待研究问题 |
参考文献 |
致谢 |
(7)56岁儿童数学问题解决认知诊断评估工具的开发及应用研究(论文提纲范文)
内容摘要 |
ABSTRACT |
1 绪论 |
1.1 问题提出 |
1.2 研究意义 |
1.3 核心概念 |
1.4 研究问题 |
1.5 论文框架 |
2 文献综述 |
2.1 儿童早期的数学问题解决 |
2.2 儿童早期数学问题解决的评估 |
2.3 儿童早期数学问题解决的教育干预研究 |
2.4 已有研究的述评 |
3 研究设计 |
3.1 研究目标及技术路线 |
3.2 5~6 岁儿童“数与运算”问题解决认知诊断评估工具的开发(研究一) |
3.3 5~6 岁儿童数学问题解决认知诊断评估工具的应用(研究二) |
3.4 5~6 岁儿童数学问题解决的教育干预研究(研究三) |
3.5 研究伦理的规范 |
4 研究一5~6岁儿童“数与运算”问题解决认知诊断评估工具的开发 |
4.1 子研究一构建5~6 岁儿童“数与运算”问题解决的认知模型 |
4.2 子研究二编制5~6 岁儿童“数与运算”问题解决的认知诊断测验 |
4.3 子研究三检验认知模型及认知诊断测验的质量 |
4.4 研究一讨论 |
4.5 研究一结论 |
5 研究二5~6 岁儿童“数与运算”问题解决的认知诊断评估 |
5.1 子研究四5~6岁儿童“数与运算”问题解决的认知诊断评估(横向研究) |
5.2 子研究五5~6岁儿童“数与运算”问题解决的认知诊断评估(跟踪研究) |
5.3 研究二讨论 |
5.4 研究二结论 |
6 研究三基于认知诊断评估的数学教育干预对5~6岁儿童数学问题解决的影响研究 |
6.1 基于认知诊断评估的数学教育干预的研究设计和实施 |
6.2 数学问题解决教育干预的结果与分析 |
6.3 数学问题解决教育干预的案例分析 |
6.4 研究三讨论 |
6.5 研究三结论 |
7 综合讨论 |
7.1 应用认知诊断理论开发学前数学领域的评估工具 |
7.2 基于认知诊断评估监测5~6 岁儿童数学问题解决能力的发展 |
7.3 基于认知诊断评估开展教育干预研究 |
8 研究结论、不足及教育应用 |
8.1 研究结论 |
8.2 研究不足及展望 |
8.3 教育应用与建议 |
英文参考文献 |
中文参考文献 |
附录1 儿童口语报告分析举例 |
附录2 《5~6岁儿童“数与运算”问题解决认知诊断测验》(正式版)的使用手册(部分) |
附录3 五种教育干预的进程、目标及内容举例 |
附录4 一对多推理干预的案例 |
在读期间公开发表论文(着)及科研情况 |
致谢 |
(8)基于机器学习的数据库技术综述(论文提纲范文)
1 引言 |
1.1 研究背景 |
1.2 研究问题 |
1.2.1 数据库运维 |
(1)性能监控. |
(2)配置优化. |
(3)故障处理与恢复. |
(4)容灾备份. |
1.2.2 数据存储 |
(1)存储模型. |
(2)数据扩容. |
1.2.3 优化器与执行器 |
(1)基数估计. |
(2)计划选择. |
(3)分布式协同机制. |
1.2.4 查询优化 |
(1) SQL重写. |
(2)索引推荐. |
(3)视图推荐. |
1.2.5 数据库负载管理 |
(1)负载分析. |
(2)负载调度. |
(3)负载预测和生成. |
1.2.6 数据库安全与隐私 |
(1)智能数据隐藏. |
(2)智能审计. |
(3)安全漏洞自检测. |
1.2.7 数据库自管理 |
(1)自诊断. |
(2)自恢复. |
(3)可视化的数据库管理工具. |
1.2.8 数据库支持机器学习 |
(1)机器学习作为用户定义函数(UDF). |
(2)机器学习作为物化视图. |
(3)自动机器学习. |
1.3 机器学习技术带来的挑战 |
1.3.1 高质量的训练数据少 |
(1)样本质量. |
(2)样本数目. |
(3)样本多样性. |
1.3.2 训练时间过长 |
1.3.3 适应能力不足 |
(1)多样的硬件环境. |
(2)多样的用户负载. |
(3)多样的用户需求. |
1.3.4 机器学习模型与数据库技术的匹配 |
1.4 论文结构 |
2 数据库调参技术的研究 |
2.1 传统调参技术 |
2.1.1 辅助决策的调参工具 |
(1)基于规则的调参工具. |
(2)基于经验模型的调参工具. |
2.1.2 基于启发式算法的自动调参系统 |
2.2 基于机器学习的调参技术 |
2.2.1 基于传统机器学习的调参技术 |
(1)特征抽取. |
(2)参数学习. |
2.2.2 基于深度强化学习的调参技术 |
2.3 面向大数据分析引擎的调参技术 |
2.3.1 基于经典算法的大数据分析引擎调参技术 |
2.3.2 基于深度学习的大数据分析引擎调参技术 |
2.4 未来方向 |
3 基数估计技术的研究 |
3.1 传统基数估计技术 |
3.1.1 基于直方图(Histogram)的算法 |
3.1.2 基于数据画像(Sketching)的统计方法 |
3.1.3 基于采样的方法 |
3.2 基于机器学习的基数估计 |
3.2.1 面向查询的基数估计 |
3.2.2 面向执行计划的基数估计 |
3.3 未来工作 |
4 查询计划选择技术的研究 |
4.1 静态计划选择算法 |
4.1.1 基于动态规划的计划搜索方法 |
4.1.2 基于启发式算法的连接计划选择算法 |
4.2 基于机器学习的计划选择算法 |
4.2.1 基于估计器的自适应性方法 |
4.2.2 基于强化学习的适应性算法 |
4.3 未来工作 |
(1)更强大的数据表征方法. |
(2)深度Q网络算法的特点是直接学习评判策略. |
(3)动态特性的支持. |
(4)迁移算法. |
5 索引自动推荐技术的研究 |
5.1 索引生成技术 |
5.1.1 学习型索引 |
(1)范围索引. |
(2)点索引. |
(3)布隆过滤器. |
5.1.2 未来工作 |
5.2 索引选择技术 |
5.2.1 在线方法 |
(1)工作负载分析. |
(2)索引方案选择. |
(3)索引方案实现. |
5.2.2 离线方法 |
(1)单查询优化. |
(2)工作负载优化. |
5.2.3 半自动化索引调整 |
5.2.4 基于机器学习的索引选择 |
5.2.5 未来工作 |
6 物化视图自动选择 |
6.1 识别等价子查询 |
6.1.1 基于符号表示的等价判断 |
6.1.2 基于逻辑语义的等价判断 |
6.2 自动选择子查询构建视图 |
6.2.1 基于DAG图的启发式方法 |
6.2.2 基于ILP的优化算法 |
6.2.3 基于策略的物化视图动态选择 |
6.3 未来展望 |
7 研究展望与未来趋势 |
7.1 自治数据库 |
(1)自动管理. |
(2)自动调优. |
(3)自动组装. |
7.2 OLAP 2.0:多元异构数据管理 |
7.3 机器学习在云数据库上的应用 |
(1)无服务器化. |
(2)负载压力. |
(3)隐私和数据安全. |
7.4 智能运维服务 |
7.5 智能计算资源调度 |
7.6 基于自然语言的数据库查询技术 |
7.7 基于学习的数据库组织模式 |
7.8 数据库系统支撑机器学习 |
8 总结 |
(9)高速网络访问超点检测算法研究(论文提纲范文)
摘要 |
ABSTRACT |
本论文专用术语 |
第1章 绪论 |
1.1 互联网中的访问超点 |
1.2 访问超点定义 |
1.3 访问超点检测现有相关工作 |
1.3.1 精确访问超点检测算法(统计方法) |
1.3.2 基于估值的访问超点检测算法 |
1.3.3 利用GPU加速访问超点检测 |
1.3.4 现有工作的不足 |
1.4 实验平台 |
1.4.1 CERNET南京主节点 |
1.4.2 NBOS的访问超点检测功能 |
1.4.3 IPTAS |
1.5 研究目标和研究内容 |
1.6 论文的组织结构 |
第2章 基于估算的访问超点检测算法 |
2.1 基数估算算法 |
2.1.1 基数估算算法原理 |
2.1.2 PCSA算法 |
2.1.3 LogLog算法与HperLogLog算法 |
2.1.4 LE算法 |
2.2 现有的访问超点的估算检测算法 |
2.2.1 DCDS算法 |
2.2.2 VBFA算法 |
2.2.3 CSE算法 |
2.2.4 CBF算法 |
2.3 访问超点检测算法的评价 |
2.3.1 错误率 |
2.3.2 占用内存 |
2.3.3 计算时间 |
2.3.4 适用环境 |
2.4 基于实测数据的实验对比(CPU平台) |
2.4.1 实验方案 |
2.4.2 实验数据 |
2.4.3 各组实验数据下的实验结果 |
2.4.4 各算法内存使用对比 |
2.4.5 各算法总错误率对比 |
2.4.6 各算法运行时间对比 |
2.4.7 实验总结 |
2.5 本章总结 |
第3章 基于GPU的实时访问超点检测框架 |
3.1 GPU通用计算 |
3.2 访问超点检测算法在GPU上运行的条件 |
3.3 现有算法在GPU上运行的可行性 |
3.3.1 不可并行的访问超点检测算法 |
3.3.2 可并行的访问超点检测算法 |
3.4 基于GPU的访问超点检测通用框架 |
3.4.1 算法初始化 |
3.4.2 缓存IP地址对 |
3.4.3 扫描IP地址对 |
3.4.4 估算访问超点 |
3.5 GPU实时访问超点检测实验 |
3.5.1 实验环境和实验方案 |
3.5.2 访问超点检测算法在GPU上运行的时间测度 |
3.5.3 DCDS算法在GPU上的运行结果 |
3.5.4 VBFA算法在GPU上的运行结果 |
3.5.5 CSE算法在GPU上的运行结果 |
3.5.6 不同GPU平台对算法运行时间的影响 |
3.5.7 GPU平台实验总结 |
3.6 本章小节 |
第4章 面向滑动时间窗口的访问超点检测算法 |
4.1 离散时间窗口与滑动时间窗口 |
4.2 滑动时间窗口下的基数估算与访问超点检测 |
4.2.1 滑动时间窗口下的基数估算 |
4.2.2 滑动时间窗口下的访问超点估算 |
4.3 模糊估值原理和滑动模糊估值器 |
4.3.1 模糊估值器 |
4.3.2 滑动模糊估值器 |
4.3.3 滑动线性估值器 |
4.4 基于SRE和SLE的访问超点检测 |
4.4.1 滑动估值器矩阵 |
4.5 SRLA算法 |
4.5.1 核心数据结构的更新方法 |
4.5.2 估算候选访问超点连接对端数 |
4.5.3 窗口边界的数据维护 |
4.5.4 SRLA在GPU上的并行实现 |
4.6 本章实验 |
4.6.1 实验目的与方案 |
4.6.2 SRLA算法在离散时间窗口下的实验结果 |
4.6.3 离散时间窗口下SRLA算法占用内存与错误率对比 |
4.6.4 离散时间窗口下SRLA算法运行时间分析 |
4.6.5 SRLA算法在滑动时间窗口下的实验 |
4.6.6 实验总结 |
4.7 SRLA算法总结 |
第5章 低状态维护时间的连接对端数估算算法 |
5.1 滑动时间窗口下低状态维护时间的计数器 |
5.2 基于异步时间戳的连接对端数估算算法 |
5.2.1 虚拟异步时间戳估计器 |
5.2.2 将VATE部署于GPU |
5.3 滑动时间窗口下的VATE实验 |
5.3.1 计数器个数对算法准确率和内存占用的影响 |
5.3.2 VATE运行时间分析 |
5.3.3 VATE算法实验总结 |
5.4 本章总结 |
第6章 分布式访问超点检测 |
6.1 分布式访问超点检测模型与难点 |
6.1.1 检测模型 |
6.1.2 要求与难点 |
6.1.3 本文的解决思路 |
6.2 基于RE的分布式访问超点检测算法 |
6.2.1 READ算法原理 |
6.2.2 分布式扫描IP地址对 |
6.2.3 生成全局候选访问超点 |
6.2.4 估算全局访问超点 |
6.3 基于GPU的分布式访问超点检测 |
6.4 滑动时间窗口下的分布式访问超点检测 |
6.5 READ算法实验分析 |
6.5.1 实验结果 |
6.5.2 READ算法与现有算法的内存和错误率对比 |
6.5.3 READ算法的运行时间对比 |
6.5.4 观测点与全局服务器传输数据分析 |
6.5.5 READ算法实验总结 |
6.6 本章总结 |
第7章 总结与展望 |
7.1 总结 |
7.2 本论文的创新点与成果 |
7.2.1 访问超点检测算法移植到GPU上的条件与通用框架 |
7.2.2 将模糊估值器引入访问超点检测算法 |
7.2.3 滑动时间窗口下的访问超点检测算法 |
7.2.4 滑动时间窗口下的异步时间戳计数器 |
7.2.5 分布式环境下低通信开销的访问超点检测算法 |
7.3 不足及展望 |
7.3.1 将SRLA部署在高速信道上或大规模网络边界实时运行 |
7.3.2 利用VATE算法实现访问超点检测 |
7.3.3 访问超点的分类研究 |
7.3.4 IPv6网络的访问超点检测 |
致谢 |
参考文献 |
附录A |
作者简介 (包括在学期间发表的论文和取得的学术成果清单) |
(10)等级调制码的构造方法研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 编码理论 |
1.1.1 数据存储系统模型 |
1.1.2 信道编码的发展 |
1.1.3 信道编码的意义 |
1.2 等级调制码的研究现状 |
1.2.1 置换纠错码 |
1.2.2 置换检错码 |
1.2.3 多重置换纠错码 |
1.2.4 置换与多重置换纠删码 |
1.2.5 置换码存在的问题 |
1.3 本文主要研究内容及安排 |
第二章 闪存的等级调制方案 |
2.1 闪存系统 |
2.1.1 闪存系统结构 |
2.1.2 闪存中的问题 |
2.2 等级调制方案 |
2.2.1 等级调制置换码 |
2.2.2 等级调制多重置换码 |
2.2.3 置换及多重置换理论 |
2.3 等级调制码的错误类型 |
2.3.1 有限电荷变化错误 |
2.3.2 电荷变化错误 |
2.3.3 强度有限错误 |
2.3.4 单元删除和擦除错误 |
2.4 小结 |
第三章 切比雪夫距离下系统置换码的编译码算法 |
3.1 引言 |
3.2 置换理论 |
3.2.1 基本概念 |
3.2.2 Ranking置换 |
3.3 系统置换码的编码 |
3.3.1 系统置换码的构造 |
3.3.2 系统置换码的编码 |
3.4 系统置换码的译码 |
3.5 小结 |
第四章 切比雪夫距离下基于陪集划分的系统置换码的构造 |
4.1 引言 |
4.2 系统置换码的基本概念 |
4.3 切比雪夫距离下置换码的构造 |
4.3.1 子群码的构造 |
4.3.2 系统置换码的构造 |
4.3.3 系统置换码的渐进分析 |
4.4 置换的ranking和多重置换的M_ranking |
4.4.1 置换的ranking映射 |
4.4.2 多重置换的M_ranking映射 |
4.5 系统置换码的编译码算法 |
4.5.1 系统置换码的编码 |
4.5.2 系统置换码的译码 |
4.6 小结 |
第五章 纠单个突发删除错误的置换码和多重置换码 |
5.1 引言 |
5.2 预备知识 |
5.2.1 基本概念 |
5.2.2 Levenshtein置换码 |
5.3 纠单个突发删除错误的置换码 |
5.3.1 置换码的构造 |
5.3.2 置换码的性能比较 |
5.4 纠单个突发删除错误的多重置换码 |
5.4.1 多重置换码的构造 |
5.5 小结 |
第六章 纠单个突发擦除错误的t平衡多重置换码 |
6.1 引言 |
6.2 预备知识 |
6.2.1 基本概念 |
6.2.2 两类纠单个PIE的置换码 |
6.3 构造纠单个突发擦除错的多重置换码 |
6.3.1 解调t平衡的多重置换码 |
6.3.2 基于引理6.3的平衡多重置换码的构造 |
6.3.3 基于构造6.1的平衡多重置换码的构造 |
6.3.4 多重置换码的性能比较 |
6.4 小结 |
结论和展望 |
研究结论 |
研究展望 |
参考文献 |
致谢 |
作者简介 |
四、集合的基数与元素个数(论文参考文献)
- [1]大规模知识图谱的查询处理技术研究[D]. 郭欣彤. 哈尔滨工业大学, 2021(02)
- [2]几类序列的伪随机性证明[D]. 路帆. 西安理工大学, 2021(01)
- [3]时间异步和非同视域条件下的分布式融合算法研究[D]. 李固冲. 电子科技大学, 2021(01)
- [4]RFID系统中的一种高效持续扫描协议[D]. 李东林. 大连海事大学, 2020(01)
- [5]面向数据集覆盖问题的优化算法研究[D]. 刘荣鑫. 哈尔滨工业大学, 2020(02)
- [6]关于有限集合组合学的若干研究[D]. 陈娜. 北京工业大学, 2020(06)
- [7]56岁儿童数学问题解决认知诊断评估工具的开发及应用研究[D]. 李莉. 华东师范大学, 2020(08)
- [8]基于机器学习的数据库技术综述[J]. 李国良,周煊赫,孙佶,余翔,袁海涛,刘佳斌,韩越. 计算机学报, 2020(11)
- [9]高速网络访问超点检测算法研究[D]. 徐杰. 东南大学, 2019(11)
- [10]等级调制码的构造方法研究[D]. 韩辉. 西安电子科技大学, 2019(02)