规则分词论文-琚四化,鲁明辉,张居晓,刘春玲,徐琴

规则分词论文-琚四化,鲁明辉,张居晓,刘春玲,徐琴

导读:本文包含了规则分词论文开题报告文献综述及选题提纲参考文献,主要关键词:盲文,分词连写,语法

规则分词论文文献综述

琚四化,鲁明辉,张居晓,刘春玲,徐琴[1](2019)在《汉语盲文分词连写规则的研究进展与展望》一文中研究指出分词连写规则是当前我国大陆地区书写汉语盲文时必须遵守的书写规范。针对分词连写规则,研究着重探讨了分词连写对汉语盲文阅读的促进作用,以及分词连写规则存在的条目过多、内容过度依赖汉语语法和部分规则内容不够明确叁个方面的问题,并提出了调整、简化和取消叁类改进措施。未来可展开针对分词连写功能的比较研究、针对分词连写规则问题的调查研究和针对具体改进措施的实验研究。(本文来源于《中国特殊教育》期刊2019年03期)

王志超,孙建斌,秦瑞丽[2](2018)在《基于分词的关联规则预测系统研究》一文中研究指出定向文本预测,往往存在预测不准、数据量大、针对性不高等问题。提出基于分词的关联规则预测方法,以煤化工行业为例进行发展方向的预测。对预测主题近期新闻标题进行层迭隐马尔可夫模型的初步分词,对得到的词集进行虚词修剪及喻词实化完成语义统一形成参与关联规则的事务集;通过提出的基于分词的关联规则算法Apriori_Split对事务集进行计算,最终得到预测结果。实验表明,该预测方法简单有效,可以极大提高预测准确性。(本文来源于《计算机应用与软件》期刊2018年12期)

袁向铎[3](2018)在《基于统计和规则的中文地址分词系统设计与实现》一文中研究指出近年来,信息技术日新月异,带动了各个行业的迅速发展,相应的数据量也在不断剧增,地址信息也相应地跟随更新和增加。电子地图的出现使得文字描述的地址能够映射到地理空间坐标上,实现这种映射的技术即为地理编码技术。地理编码一般包括地址标准化、地址分词、地址匹配、空间定位等步骤。其中,地址分词的作用主要是采用某一分词方法将中文地址拆分成若干个最小地址单元,为后续的地址匹配过程做铺垫,这也是地理编码中最为核心、关键的一步。本文主要对中文地址分词进行研究,重点分析中文地址的组成特点和规则,采用条件随机场模型解决中文地址分词中的未登录词识别问题,并构建出基于标准地址模型的知识库,基于此知识库设计出适用于中文地址标准化分词的算法,开发出可靠的中文地址分词原型系统,并通过实验验证其可行性。论文具体工作如下:1.构建基于标准地址模型的知识库。地址模型是本文研究对象中文地址中地址要素的组织方式,直接影响后面分词算法的设计和最终分词的准确率。通过对海量的中文地址数据的组成特点的研究和总结,中文地址分词需要完整的全国行政区划等级库,地址特征词库和地理实体名词库作为分词依据。2.设计有效的中文地址分词算法。中文分词算法的设计包括分词算法的选取和基于地址组成规则的分词结果处理算法的设计。由于分词算法已经比较成熟,结合中文地址特点,本文依据构建的知识库采用双数组trie树的字符串匹配方法对中文地址进行初步分词;针对初步分词结果中的歧义、错分等现象,本文又设计了基于地址组成规则的分词结果处理算法来对其进行消歧义、推导验证等处理,大大提高了分词的准确率。3.开发实现了一个中文地址分词的原型系统。本论文基于上述的地址知识库和中文地址分词算法开发、实现了中文地址分词原型系统,对该系统的性能和功能进行了实验测试,并与纯规则的分词方法做了比对,实验结果表明采用统计和规则的分词系统的分词准确率可达92.37%,远高于纯规则方法的分词结果,证明了系统的可靠性。(本文来源于《东南大学》期刊2018-05-01)

高璐[4](2017)在《规则动词的现在分词的构成》一文中研究指出(本文来源于《小学生学习指导》期刊2017年Z1期)

刘宇宁[5](2015)在《法语过去分词独立使用时的特殊配合规则》一文中研究指出法语中过去分词的用法是学习者们既熟悉又陌生的一个语法内容,熟悉无疑是因为它的使用非常频繁,是动词体系的重要组成部分;而陌生则是由于其配合规则纷繁复杂,需进行十分细致的区别。过去分词与助动词avoir,etre搭配使用时的一般规则已为众多法语学习者所熟悉。而过去分词作为形容词或介词独立使用时的配合规则却具有一定的特殊性,本文拟将这些特殊情况及其配合规则进行总结和梳理。(本文来源于《法语学习》期刊2015年06期)

孙宇,李纯莲[6](2015)在《应用“层次分析法”优化汉语盲文分词连写规则》一文中研究指出应用现有的分词连写规则书写汉语普通话盲文,会因人因时而得到不同的分词结果。为减少这种分词的不确定性,提出了应用"层次分析法"优化分词规则的方案。首先论述了普通话盲文的"结构分层"理论,继而给出了优化分词连写规则的总体原则、思路和优势,在详细介绍层次分析法基础理论后给出了应用层次分析法分词的原则,并列举有代表性的11个实例进行分析。改进的分词策略,不仅简化了分词规则、在很大程度上减少了盲文分词的不确定性,简单易用。(本文来源于《长春大学学报》期刊2015年05期)

林雪娥,杨鉴,熊艳娇,刘怀憬,李诗心[7](2013)在《基于拼写规则和最大匹配算法的泰语分词》一文中研究指出泰语文本中的句子由词拼接而成,词与词之间一般没有空格。句子之间用空格分开,然而空格并不都是表示句子的边界,因此分词和划分句子边界是泰语文本分析的必要环节。本文基于泰语词的拼写特点,归纳字符连缀规则,构建泰语字符连缀单元集合,在此基础上并采用前后向的最大字符匹配算法对泰语文本进行分词。实验结果表明,该泰语文本分词方案,不仅提升了分词的准确率,而且也提高了匹配算法的查找速度。(本文来源于《需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集》期刊2013-08-05)

王崇[8](2013)在《基于带词长和规则判定的中文分词技术的研究》一文中研究指出随着计算机软件和硬件以及计算机网络的飞速发展,人们已经进入信息时代。在这个信息社会里,信息的重要性与日俱增,无论是个人、公司、乃至政府都需要获取和掌握大量有用的信息。在这种环境下,中文信息处理技术逐渐成为一项需要重点研究的技术,而其中最为重要的就是中文分词技术。中文与英文不同,中文文本是一个连续的字符串,除了标点符号之外,词与词之间并没有明显的切分标志,也就是语言文字的书写方法没有词界,因而中文信息处理的首要问题是词的切分问题。本文在研究了中文分词各种算法和技术的基础上,提出了一种带词长的哈希词典机制有效的提高了长词的匹配效率,并提出一种基于动词判定算法和优先级判定算法的歧义消解机制,有效地提高了歧义消解的精确性。以下是本文具体的研究内容:(1)研究了中文分词的研究背景和研究意义;中文分词的相关技术以及现有的几种主流的中文分词算法。现有的中文分词算法主要有:基于词典的分词算法,基于统计的分词算法,基于规则的分词算法和基于理解的分词算法等。在主流的分词系统中主要用到的是基于词典的分词算法。(2)研究了现有的几种词典机制:基于整词二分的词典机制、基于TRIE树的分词词典机制、基于逐字二分的分词词典机制和基于哈希的分词词典机制。综合存储空间和查找时间上两方面的考虑,进行了以上几种词典机制的比较,本文采用基于哈希的分词词典机制。针对长词匹配效率不高的问题,本文提出了一种带词长的哈希词典机制。(3)研究了中文分词主要面临的问题:歧义问题。歧义包括:交集型歧义、组合型歧义和真歧义。本文详细介绍了这叁种歧义。并介绍了主要的叁种歧义采集算法:双向最大扫描法、逐词扫描的最大匹配法、最长词次长词发现算法。本文采用双向最大扫描的歧义采集方法。歧义采集后,本文改进了退一字组合算法,加入了动词判定算法和优先级判定算法来进行歧义的消解,在一定程度上提高了歧义消解的精确性。(4)采用VC++6.0集成开发工具,利用本文所提出的算法设计并实现了中文分词系统,并描述了系统的体系结构和系统中各模块的工作原理。(本文来源于《青岛科技大学》期刊2013-06-08)

贺欢[9](2013)在《统计与规则相结合的中文分词模型设计与实现》一文中研究指出随着信息化的普及,人们的工作和学习已经离不开网络信息。同时,随着网络信息规模的不断扩大,如何高效、准确地获取相关的中文信息逐渐成为人们关注的问题。中文分词是中文信息处理的重要步骤,中文分词系统的分词精度直接影响着中文信息理解与处理的效率。因此,本文展开这一方面的研究具有重要的意义。首先,本文阐述了中文分词的研究背景与意义。分析了目前常用的叁种中文分词方法的基本原理及各自的优缺点,并讨论了中文分词的两个技术难点:歧义识别和未登录词识别。对歧义产生的原因、分类和目前主流的歧义抽取及消除方法等作了详细的阐述,同时详细阐释了未登录词的分类和主要的识别方法。并对本文使用的几个统计模型进行了简单的介绍。其次,本文对基于层迭隐马分词模型和基于扩充转移网络(Augmented Transfer Network, ATN)的中文分词技术进行深入研究,提出将隐马模型和ATN句法分析相结合的中文分词框架,并在此基础上实现了中文分词系统原型。具体地,该系统使用基于统计的N-最短路径初分模型和ATN句法分析相结合的方法进行歧义切分;使用简单的规则识别数词和时间词;使用基于角色的未登录词识别方法识别出汉语人名和地名。继而将识别得到的未登录词和其它词一起参与竞争,建立基于类的隐马分词模型以获得全局最优的分词序列,并对该序列进行词性标注。最后,本文对该系统做了叁个方面的分词实验。本文对搜集到的100句具有歧义现象的语料进行歧义切分对比实验,该系统能够正确分析其中的83句,而国内某分词系统能够正确分析其中的75句;随机选取六个不同领域的测试语料各一篇进行了开放测试;选取1998年《人民日报》的一段语料作为测试语料做对比实验,并将切分结果与国内某分词系统切分结果进行对比分析。由实验测试结果可知,本文的歧义识别效果好于国内某分词系统。通过任意选择六个领域的测试语料对本文进行测试,分词准确率平均值达到94.28%,分词召回率平均值达到96.25%,分词切分F-指数平均值达到95.25%。对比实验结果表明,本文分词召回率略高于国内某分词系统,总体分词准确率与国内某分词系统基本一致。(本文来源于《西南交通大学》期刊2013-05-01)

程昌秀,于滨[10](2011)在《一种基于规则的模糊中文地址分词匹配方法》一文中研究指出在研究分析地址模型的基础上,建立了存储标准地址数据集的标准地址库和自定义的地址匹配规则库,提出了一种基于规则的模糊中文地址编码方法。该方法在依据标准地址库分词的同时,也沿着自定义的地址匹配规则进行推理,从而缩小了下次分词所用到的目标数据集,提高了系统执行效率。另外,通过借助构建的规则树与歧义栈,提高了文中定义的两类模糊地址匹配的成功率。最后,基于该算法建立了一个地理编码原型系统,并利用经济普查项目中的相关数据对算法的可用性进行了验证。(本文来源于《地理与地理信息科学》期刊2011年03期)

规则分词论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

定向文本预测,往往存在预测不准、数据量大、针对性不高等问题。提出基于分词的关联规则预测方法,以煤化工行业为例进行发展方向的预测。对预测主题近期新闻标题进行层迭隐马尔可夫模型的初步分词,对得到的词集进行虚词修剪及喻词实化完成语义统一形成参与关联规则的事务集;通过提出的基于分词的关联规则算法Apriori_Split对事务集进行计算,最终得到预测结果。实验表明,该预测方法简单有效,可以极大提高预测准确性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

规则分词论文参考文献

[1].琚四化,鲁明辉,张居晓,刘春玲,徐琴.汉语盲文分词连写规则的研究进展与展望[J].中国特殊教育.2019

[2].王志超,孙建斌,秦瑞丽.基于分词的关联规则预测系统研究[J].计算机应用与软件.2018

[3].袁向铎.基于统计和规则的中文地址分词系统设计与实现[D].东南大学.2018

[4].高璐.规则动词的现在分词的构成[J].小学生学习指导.2017

[5].刘宇宁.法语过去分词独立使用时的特殊配合规则[J].法语学习.2015

[6].孙宇,李纯莲.应用“层次分析法”优化汉语盲文分词连写规则[J].长春大学学报.2015

[7].林雪娥,杨鉴,熊艳娇,刘怀憬,李诗心.基于拼写规则和最大匹配算法的泰语分词[C].需将论文集名称修改为“第十二届全国人机语音通讯学术会议(NCMMSC2013)论文集.2013

[8].王崇.基于带词长和规则判定的中文分词技术的研究[D].青岛科技大学.2013

[9].贺欢.统计与规则相结合的中文分词模型设计与实现[D].西南交通大学.2013

[10].程昌秀,于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学.2011

标签:;  ;  ;  

规则分词论文-琚四化,鲁明辉,张居晓,刘春玲,徐琴
下载Doc文档

猜你喜欢