导读:本文包含了语音检测论文开题报告文献综述及选题提纲参考文献,主要关键词:语音测试,声音检测类,测试
语音检测论文文献综述
柳燕飞,蒋庆磊,牛林林[1](2019)在《声音检测类语音识别系统的测试方案分析》一文中研究指出文章提供了一种针对声音检测类语音识别系统的测试方案,可以实现对命令词的选取、存取及再现,进行纯净环境命令词测试和干扰环境容错能力测试,并直接输出测试结果。使用本方案可以提高语音识别能力测试的测试结果的准确率,以及相关声音检测类系统的横向可比性。(本文来源于《南方农机》期刊2019年20期)
梁慧[2](2019)在《嵌入式英语语音识别系统误差自动检测方法研究》一文中研究指出为了提高嵌入式英语语音识别系统发音误差自动检测能力,提出基于时频分析和关联信息熵特征提取的嵌入式英语语音识别系统发音误差自动检测方法。采用时频特征分解方法进行嵌入式英语语音识别系统英语发音信号的降噪处理,对降噪输出的英语发音信号进行特征分解和关联维特征配准,结合小波多层重构方法进行语音信号的重组,提取英语发音信号的关联信息熵特征,根据提取的语音信号的关联信息熵特征进行自动匹配,实现对嵌入式英语语音识别系统误差的自动识别。仿真结果表明,采用该方法进行嵌入式英语语音识别系统发音误差自动检测的准确性较好,对语音信号的分辨能力较好,提高了嵌入式英语语音识别系统的发音误差的检测性能。(本文来源于《自动化与仪器仪表》期刊2019年09期)
季卫松[3](2019)在《基于TMS320F28335语音信号端点检测的硬件与软件设计》一文中研究指出语音信号的端点检测是实现电话与无线电台无缝连接的关键技术。这种技术广泛应用于空管通信的语音调度、海岸电台通信的语音调度以及应急通信的语音调度。因此,设计了语音信号端点检测的硬件与软件,实现了语音信号端点的自动检测。(本文来源于《通信电源技术》期刊2019年09期)
陈昊泽,张志杰[4](2019)在《基于能量和频带方差结合的语音端点检测方法》一文中研究指出语音端点检测是语音识别中非常重要的部分,识别率高低很大程度上取决于端点检测的精确程度。在高信噪比(signal-noise ratio,SNR)的实验室环境下,端点检测有很好的效果;但比如像工厂和市场等低SNR环境下,传统的检测方法性能迅速降低,端点检测无法达到预期效果。针对低SNR语音的端点检测,先通过谱减法对带噪语音进行降噪,再分别求出每帧语音信号的能量与频带方差的乘积,将乘积值作为参数进行双门限端点检测的思路,提出了一种能量和频带方差结合的端点检测方法。将TIMIT数据集中语音迭加高斯随机噪声、NOISEX 92噪声库中的factory噪声和volvo噪声进行实验。结果表明,当SNR在-10 d B时,仍有较好的检测效果,显着提高了语音端点检测的效果。(本文来源于《科学技术与工程》期刊2019年26期)
李丹,圣明明,刘曼[5](2019)在《瞬态噪声环境下改进的语音端点检测算法》一文中研究指出针对服务机器人在使用过程中出现瞬态噪声干扰,导致语音端点检测正确率较低的问题,提出一种改进的语音端点检测算法,可实现用户语音起始点和终止点的准确判断.首先利用迭代加权最小二乘算法(I-WLS)对原始语音信号进行瞬态噪声抑制,再使用Wiener滤波对语音信号进行背景噪声滤除,最后通过能频比作为语音端点双门限判决参数,判断用户说话的起止点.试验结果表明:本文提出的算法在实际环境中端点正确检测率可以达到90.5%,能够满足服务机器人在瞬态噪声环境下提高语音端点检测率正确率的需求.(本文来源于《兰州工业学院学报》期刊2019年03期)
曾剑飞[6](2019)在《低信噪比条件下的语音端点检测算法研究》一文中研究指出语音端点检测作为各种语音信号处理系统的前端操作,在语音信号处理领域中具有重要的意义。低信噪比条件下的语音端点检测是语音处理领域的一个技术难题,阻碍了语音处理技术向嘈杂环境、短波通信等应用领域的拓展。为探寻一种理想的语音端点检测算法,既能够保证在低信噪比的环境下拥有较好的正确率,又能够满足较少的先验知识与运算量的要求。本文对低信噪比条件下的语音端点算法进行了研究,并提出相应解决思路。本文总结归纳了近几十年来语音端点检测研究的进展和成果,从语音端点检测的准确性、稳定性、自适应性和运算量上对常用的几种语音端点算法进行分析,发现在低信噪比条件下,传统的语音端点检测算法都存在检测准确率急剧下降的问题。针对这一问题,本文从提升降噪效果、提升端点检测算法鲁棒性两方面开展研究。在语音降噪方面,本文提出了一种改进的谱减降噪算法,该算法采用端点检测、分段噪声估计、动态参数调整等办法,解决了常规谱减算法存在的无话段估计困难、噪声估计不精确、音乐噪声较大等问题。在端点检测方面,本文提出了一种改进的子带能熵比端点检测算法,该算法采用子带划分、优化能量计算方式、优化谱熵计算、两级平滑处理方式等办法,有效提升了算法在不同噪声条件下的鲁棒性。在上述研究的基础上,本文还提出了一种改进谱减与子带能熵比结合的算法,该算法采用先验信噪比估计、谱减降噪、子带能熵比端点检测等办法,有效提升了算法在低信噪比条件下的鲁棒性。最后,本文使用NOISEX-92噪声库和纯净语音文件合成不同噪声类型和信噪比的带噪语音,对常规端点检测算法和本文提出的改进算法进行比较分析,验证了本文所提算法的有效性。本文开展的研究与所提出的改进算法,为低信噪比条件下的语音端点检测提供了新的思路和解决方案,具有一定的参考价值。(本文来源于《华南理工大学》期刊2019-06-04)
梁晓凤[7](2019)在《嵌入式语音采集系统设计及数据传输中的攻击检测》一文中研究指出随着电子技术的飞速发展,语音广播技术广泛应用于多种特定场景,如火车站,机场等。为了提高广播系统的安全性,降低人们的工作强度,迫切地需要提出一种适用于特定场景的广播语音采集识别系统。语音信号采集和传输系统是其中的重要环节。为了监测太原火车站各个候车厅以及站台的广播,并将广播发送至上位机进行识别,此过程需要保证语音传输的安全性,如果语音传输过程中一旦受到网络攻击,将会影响语音识别的结果。然而,目前对网络攻击检测的研究还在网络化控制领域,在语音通信领域还涉及较少,因此研究语音在传输中是否受到网络攻击的影响意义重大。本文将设计语音采集传输装置并研究语音在传输中的安全性。针对上述问题本文的主要工作如下:(1)本文将STM32单片机、VS1053音频采集模块、ESP8266 WiFi模块整合在一块电路板上,应用两个WiFi模块,其中一个WiFi发送语音信号即火车站广播,另一个WiFi发送广播的位置,设计出多节点的语音采集传输系统,此系统可以接收到火车站不同候车厅的广播并将语音传输至上位机进而识别,其传输的实时性和可靠性也进一步提升。(2)本文将利用自回归(AR)建模方法建立语音信号的模型,然后对语音信号进行预处理。同时分析了语音传输中可能存在的网络攻击,并对拒绝服务攻击(DOS)、虚假数据注入攻击(FDI)、重放攻击叁种网络攻击进行了建模。分别采用了不同的方法检测叁种网络攻击,其中利用卡尔曼滤波与卡方检测器相结合的方法检测拒绝服务攻击,采用余弦相似性匹配方法检测虚假数据注入攻击,采用残差法检测重放攻击。最后通过搭建实验平台将采集到的语音信号传输至上位机,应用攻击检测算法来识别信号是否遭受到恶意的网络攻击,仿真实验验证了所提方法的有效性。(本文来源于《山西大学》期刊2019-06-01)
吴晓迪[8](2019)在《基于多示例学习的汉语口语语音中不流利事件检测研究》一文中研究指出随着互联网的发展,人工智能越来越融入人们的工作生活中,人与机器的智能语音交互应用更加广泛,机器需要更好的理解人们各种情境环境下的语音,现阶段主要包括流利的朗读式语音、较短的命令式语音等,而在较长的自然口语语音方面,智能语音识别还面临很大的挑战。本文主要是对汉语自然口语语音数据中不流利事件的检测研究,可以看作语音识别任务的一个前端工作。不流利事件即自然口语中犹豫、填充停顿、重复等现象。它是语音中非正常语义的行为,对不流利事件的检测研究属于语音副语言研究范畴。在本文中,提取了能够很好地表征不流利语音的特点的韵律学特征和谱相关特征,并且提出了多示例学习的模型以解决在不流利语音中,不流利事件持续时间短而噪声信息过多的问题,通过训练多示例学习模型对不流利事件进行识别。论文的主要内容有:(1)汉语自然口语不流利事件语料库的构建。本文从已有标注的哈工大流媒体数据语料库中提取我们需要的流利语音和不流利语音。本文依据该原始语料库中的标注文件,分析了不流利事件的标注特点,找到不流利事件的标注规则,然后依据此规则找到了自动检测不流利事件的有效方法,自动切割不流利语音,然后通过人工复检自动切割的语料,完成了汉语自然口语不流利事件语料库的构建。(2)基于长短时记忆网络(Long Short Term Memory Network,LSTM)的不流利语音分类方法。本文使用LSTM网络模型作为基线系统,对汉语自然口语中不流利事件进行识别检测。该基线系统使用的特征为梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)语音特征。文中在介绍LSTM网络的结构特点的基础上,阐述了与此模型相关的音频预处理、特征提取、LSTM模型的训练和测试等过程,最后给出了该识别模型的测试结果。(3)基于多示例学习(Multiple Instance Learning,MIL)SVM模型的不流利事件的识别。多示例学习中包是有标签的而包中的各个示例是没有标签的,可以说多示例学习是结合了监督学习和无监督学习特点的一种学习方法。本文将多示例学习引入到口语事件识别任务中,并且将多示例学习与传统的机器学习方法支持向量机(Support Vector Machine,SVM)分类器结合,进行分类检测。该系统使用的特征为副语言特征集,该特征集中不仅包含MFCC等谱特征,还包含了一些能够很好地表征语音声学特性的韵律特征等,在以往的语音副语言识别中表现出了较好的效果;(4)基于多示例学习神经网络模型的不流利事件的识别。将多示例学习引入神经网络,构建符合多示例学习规则的误差函数,充分利用神经网络学习能力强,鲁棒性高的优点,训练一个基于多示例学习的神经网络模型,利用此模型对测试集的语音进行识别,得到识别的准确率;并在这个模型上进行了改进,增加了深度监督机制,以提高特征学习能力,提高识别准确率。最后通过实验表明此改进的方法有较好的识别效果。(本文来源于《哈尔滨工业大学》期刊2019-06-01)
赵雅珺[9](2019)在《基于深度学习的语音重播攻击检测》一文中研究指出重播他人语音以冒充他人身份会为社会安全带来严重威胁。已有的研究及实践均证明目前的说话人识别系统(Automatic Speaker Recognition,ASR)很难抵抗重播攻击。同时,这种攻击方式还具有便捷低廉的特点。因此,语音重播攻击相关的安全问题研究具有重要的现实意义。然而,目前此类研究仍然相对较少,并且一般集中于利用传统的信号处理方法进行重播语音检测,其特征提取较为复杂且不稳定,具有较大的局限性。为此,本文在数据智能驱动下的深度学习框架内对语音重播攻击的检测算法进行研究,旨在有效区分重播语音和原始语音。具体内容如下:1.提出基于卷积神经网络(Convolutional Neural Network,CNN)模型的语音重播攻击检测算法。所提出的网络结构依据语音信号的时频特征进行特殊设计,与时频图的特征分布特点高度契合,能将训练参数分配到更合理的地方,从而能使用更有效的特征来训练更紧凑的参数,因而大大降低了模型过拟合风险。同时,由于已有的算法通常缺乏通用性,即没有考虑对抗不同录音场景的鲁棒性,本文针对不同的说话人、不同的文本内容、不同的录制设备及不同的录制距离等核心影响因子进行系统的研究与测试。实验结果表明该算法对不同影响因子下的重播语音检测率均达到了99.8%以上,说明该算法具有优良的通用性,另外,本文采用时长0.2秒极短语音段作为检测数据得到以上的准确率,说明所提算法在实际应用场景中具备适用性。2.提出基于循环神经网络模型(Recurrent Neural Network,RNN)的端对端重播攻击检测算法,该算法直接对语音波形数据建模。CNN模型只能对固定长度的语音段进行检测,而RNN的模型则适用于语音长度不定的场合。所提模型采用多组不同长度的一维卷积核及较大的卷积步长来提取语音波形的时序特征,并通过RNN积累历史信息并进行检测,最终实现对各种不同长度的重播语音的端对端检测算法。结果表明该算法对于0.5秒语音段语音有99.3%以上检测率,并随语音段长度增加而增加。但由于语音波形数据特征的稀疏性,基于波形的RNN模型对于极短语音段的检测性能并不理想,对0.2秒语音段只有95.9%的检测率。因此,在此基础上继续提出基于语谱图的RNN模型,并采用迁移学习的方式进行训练。本模型利用特征更为集中的语谱图作为输入;同时,工作1中基于语谱图的CNN模型在0.2秒语音段取得极高的检测率,表明其提取的特征非常有效,因此本工作采用工作1中部分参数来初始化本部分的模型(迁移学习)。实验结果表明该方法极大地提高模型对极短语音的鲁棒性,在0.2秒长度语音段的检测率达到99.3%,并随着语音段长度的增加,检测率越高。本文所提的语音重播攻击检测算法具有优良的性能,可作为ASR系统的检测模块,使其具备抵抗语音重播攻击的能力,对信息安全建设具有重要意义。(本文来源于《广东技术师范大学》期刊2019-06-01)
陈园允[10](2019)在《变形欺骗性语音的检测算法研究及对其鲁棒的说话人识别系统实现》一文中研究指出已有研究及实践均证明语音变形(Voice Transformation,VT)、语音转换(Voice Conversion,VC)、语音合成(Speech Synthesis,SS)及重播语音等欺骗性语音能有效地欺骗自动说话人识别系统,给社会安全带来严重的危害。目前已有的研究主要集中于对VC、SS及重播语音的检测,而对VT相关的安全问题研究相对不足。然而,相较实现成本较高且算法尚未完全成熟的VC及SS等操作,VT已有的算法能在改变说话人声音的同时高度保持语音的自然性,同时实现方式及成本便捷低廉,已集成在很多语音处理工具中,并在众多的案件中作为犯罪手段。因此,研究VT欺骗性语音的安全问题具有重要意义。为此,本文研究VT欺骗性语音的检测算法,并实现对VT欺骗鲁棒的说话人识别系统。本文主要的工作如下:1.提出一种基于高斯混合模型-通用背景模型超向量的VT语音检测算法。该算法利用MFCC在UBM下自适应得出的GMM-UBM超向量作为学习特征,并利用支持向量机作为分类方法。实验结果表明,该算法的识别率能达到98.62%。同时,当测试语音时长较短时,该算法能保持高识别率。2.利用Visual Studio2013的MFC框架实现对VT欺骗性语音鲁棒的说话人识别系统。该系统的防欺骗模块基于本文所提算法及实验室团队已有算法,该模块分特征提取模块、模型训练模块及检测识别模块叁个子模块。该模块集成在基于GMM的SR系统中。经调试,该系统能有效地识别VT欺骗性语音,保证说话人识别正常的漏检率。该系统在设计上兼具简洁性和实用性,并具有很好的人机交互方式,运行时既有功能操作界面又有控制台窗口,方便了用户在系统运行时得到实时的反馈。综上,本文对VT欺骗性语音的检测进行了理论算法的研究及实用系统的开发,对欺骗性语音相关的安全问题研究有重要的理论及现实价值。(本文来源于《广东技术师范大学》期刊2019-06-01)
语音检测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了提高嵌入式英语语音识别系统发音误差自动检测能力,提出基于时频分析和关联信息熵特征提取的嵌入式英语语音识别系统发音误差自动检测方法。采用时频特征分解方法进行嵌入式英语语音识别系统英语发音信号的降噪处理,对降噪输出的英语发音信号进行特征分解和关联维特征配准,结合小波多层重构方法进行语音信号的重组,提取英语发音信号的关联信息熵特征,根据提取的语音信号的关联信息熵特征进行自动匹配,实现对嵌入式英语语音识别系统误差的自动识别。仿真结果表明,采用该方法进行嵌入式英语语音识别系统发音误差自动检测的准确性较好,对语音信号的分辨能力较好,提高了嵌入式英语语音识别系统的发音误差的检测性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音检测论文参考文献
[1].柳燕飞,蒋庆磊,牛林林.声音检测类语音识别系统的测试方案分析[J].南方农机.2019
[2].梁慧.嵌入式英语语音识别系统误差自动检测方法研究[J].自动化与仪器仪表.2019
[3].季卫松.基于TMS320F28335语音信号端点检测的硬件与软件设计[J].通信电源技术.2019
[4].陈昊泽,张志杰.基于能量和频带方差结合的语音端点检测方法[J].科学技术与工程.2019
[5].李丹,圣明明,刘曼.瞬态噪声环境下改进的语音端点检测算法[J].兰州工业学院学报.2019
[6].曾剑飞.低信噪比条件下的语音端点检测算法研究[D].华南理工大学.2019
[7].梁晓凤.嵌入式语音采集系统设计及数据传输中的攻击检测[D].山西大学.2019
[8].吴晓迪.基于多示例学习的汉语口语语音中不流利事件检测研究[D].哈尔滨工业大学.2019
[9].赵雅珺.基于深度学习的语音重播攻击检测[D].广东技术师范大学.2019
[10].陈园允.变形欺骗性语音的检测算法研究及对其鲁棒的说话人识别系统实现[D].广东技术师范大学.2019