论文摘要
本文以自然语言理解的相关问题展开,它是语言文字信息处理的一项高层次技术,是人工智能的重要内容和组成部分。它主要研究能够实现人与计算机之间用自然语言进行有效通信的各种理论和方法。本文以黄曾阳先生的概念层次网络理论为基础,分别对自然语言理解本身的概念进行了分析,然后提出自然语言理解需要实现的目标,最后试着去实现一个语音识别技术:如何识别方言。本文主要思想如下:1.建立一个合理的思维和语言模型有助于自然语言的理解,但是以目前的科学发展水平来看,难以准确而完全的构造出人脑的思维模型,计算机只能近似的模拟人的思维。语言模型的建立以儿童语言的认知为参考,具体模型的建立还有待于更进一步研究。2.传统语言学认为,人类表达的唯一手段是通过语言来实现的,人类理解的载体也只有语言这一项。可是纵观人类真实的表达和理解的过程,光是语言一项是不足以来完成整个表达和理解的过程的。通常人类采用表达和理解的手段有五种:看、听、闻、说、触。“语言”需要站在广义的角度来看。许多现代语言学家把语言的分析与理解过程看作是一个层次化的过程。新的信息出现在我们面前的时候,它通过人类的各种感觉器官进入到大脑中,经过一定的编织与安排和大脑中已有的信息相融合。就好像发电报的接收方和传送方都有一个固定的参照本,新信息到来的时候,只有和这个已有的参照本相结合,才能使新信息得到理解。3.机器语言要真正能达到对自然语言的模拟必须满足以下5个终极条件:(1)、机器语言可以不受限制的进行真实的理解的输入;(2)、机器语言可以实现与人类相类似、相匹配的信息背景;(3)、机器语言可以形成与人类相类似的精神与意识结构;(4)、机器语言能采用与人相同的运用方式去运作;(5)、机器语言可以采用与人相同的输出方式输出。4.丰富的方言资源是中国文化重要的组成部分,保护方言是一项重要的任务。建立一个方言语料库,记录各种方言的声韵调和词汇是语言学者肩上的重担。本文希望能够从襄樊方言词汇着手,设想出一个简易的方言识别模型。从语料库语言学角度来看,对襄樊方言中有地方特色的词汇进行整理和规划,输入系统当中,然后对特色词汇进行标注。当需要对一段话进行辨别时,就可以通过电脑中已经储存的语料库来对这段话进行辨别。