试论福建省方言有声语言资源数据库的建设

试论福建省方言有声语言资源数据库的建设

OntheCorpusConstructionofFujianVocalDialects

王勇卫WANGYong-wei(泉州师范学院,泉州467000)(QuanzhouNormalUniversity,Quanzhou467000,China)

摘要院本课题组用了一年的时间为福建省方言语料库建设作规划。课题组在泉州市区设了一个语音采集点,严格按照国家标准建立了一个语料库,以此为基础为全省方言语料库建设作规划。本文从人员配备、录音录像技术处理、寻找发音人、培训工作、录制过程需注意事项五个方面对即将展开的福建省方言语料库建设提出建议。

Abstract:OurresearchgrouphavebeenspendingmorethanoneyearonthestudyofFujiandialectswiththeaimtomakeoutascientificplaningonthedialectcorpusconstruction.Strictlyaccordingtoournationalstandar,anaudioacquisitionsitehasbeensetupinQuanzhou,thusbasedonwhichwewillbeabletoplanwellonFujiandialectcorpusconstructioninthewholeprovince,thispaperwillprovidemanyvaluablesuggestionsonFujiandialectcorpusconstruction,mianlyfromsuchfiveaspectsofmaininglevels,audio-visualmaterialprocessingtechnology,subjectchosing,trainingissuesaswellastherecordingprocess.

关键词院福建方言;语料库;规划Keywords:Fujiandialect;corpus;planing中图分类号院G250.74文献标识码院A文章编号院1006-4311(2014)21-0243-020

引言去年到今年,笔者所在课题组用了一年的时间为福建省方言有声语言数据库建设作规划,并进行试点实验工作。福建是一个方言大容不省,福建省有声语言资源语料库的建设对全国库的建设有着举足轻重的作用。福建省内有闽方言和客家方言,而且闽方言又可细分为闽南、闽中、闽中、闽北和莆仙方言。这些不同方言在数据库建设中,有共性也有个性。在建设程序和操作方面,它们是一样的,所不同的在于发音人的培训内容和转写汉字及注音工作。

方言有声语料建设是一项标准化程度高的工作,通过一年的试验,我们认为要做好以下几方面工作:1人员配备分为专家和工作人员。

专家为本语料库建设提供理论支持。专家类型主要为方言、普通话、音像制作等方向,还可根据需要增加计算语言学方向的专家。

工作人员的职责为:寻找发音人、培训发音人、录音和摄像及其技术处理、记音和文字转注及标注国际音标、验收和打包。可把工作人员分为:后勤联络组、技术组、培训标注组。

2录音录像技术处理2.1设备选择2.1.1录音设备《中国语言资源有声数据库调查手册———汉语方言》指定了两套设备:我们购买了其中的一套,即SAMSONC03U话筒。但在测试中,我们发现这支话筒声音闷而且虚,背景噪音很大。从录音效果看,清晰度不如几十元钱的带耳机话筒。

另一套设备含两部分:话筒和声卡。本课题在运作中没有购买此套设备,因此,设备的真实性能还不了解。

需耳机一个,供监听用。

电脑宜采用笔记本电脑。笔记本电脑易携带,工作时底噪小。

还需移动硬盘,供资料保存、携带用。

录音软件除了指定的byly外,还可使用Samplitude软件。前一个软件非常适合语言普查用,后一个软件功能强大,能对录音素材、甚至能对视频中的声音进行处理。

本课题在录制中使用的是高于《中国语言资源有声数据库调查手册———汉语方言》指定的设备,采用TC声卡和AKG电容话筒。这套设备已达到专业级的水平,声音清晰而饱满。

2.1.2录像设备建议采用高清硬盘摄像机。本课题使用的是松下高清硬盘摄像机。

为了保证图像和声音的质量,还建议添置以下设备:淤三角架。于摄像机用无线话筒或方向性话筒。盂三盏800W红头灯。榆背景布和背景架。建议使用蓝色背景布。

2.2录音和摄像地点选择录音和摄像场地要求隔音、没有回音。如果有回音,可拉上窗帘或在场地上放一些衣服、棉被等物品进行吸音。

尽量在专业录音室和电视演播室录制,这样录制不但质量好,而且录制的速度快。

2.3录像录音可合二为一语料库建设有的部分既需要录音又需要录像,我们不必用两套设备进行采录,只要保证录像的声音质量就可以了,等录制后用Samplitude软件把声音分离出来。

3寻找发音人找到恰当的发音人,后面的工作将会很顺利地进行,如果找到的发音人不理想,将极大地影响后面的工作。发音人第一难找的是老男,第二难找的是老女,第三难找的是地普3。

我们找老男的原则是:文凭不高,但有丰富的社会知识;没有长时间外出。

由于采录点都是设在城市和县城,而且发音人要有一定的文化(认得字),这就为寻找地普3增加了难度。因为符合以上两个条件的人普通话大多达到三级水平。

对于发音人的寻找,我们有以下几个建议:淤要依靠各地语委等行政部门以及老人协会的支持。

老男老女可以由老人协会帮助寻找;地普可让语委从普通话水平等级测试中的三级以及不入级者中寻找。然后由语料库工作人员确定最终人选。于语料库工作人员确定了人选后,要与发音人充分交流,建立感情。盂除了确定正式发音人外,还要确定后备发音人。

4培训工作重点是采录内容的培训。培训人员要与发音者一个字、一个词、一个句地确定发音。

培训人员在培训前要做好充分准备,自己对采录的所有内容都要非常熟悉。要明白在培训中不是培训人员跟着发音走,而是要具有指导发音人发音的能力(尽管这种指导不是直接把答案告知发音者的)。

培训人员在对发音人进行培训时,发现发音人发音不稳定、不准确时,培训人员不能直接把读音发出来,可对发音人进行启发。启发方法有两个:一是把此字、此词、此句的意义告诉发音人,让发音人根据意思发音;二是把此字、此词、此句放在具体的语言环境中,即说出一个包含此字或此词的句子或段落,但用“什么”代替此字、此词或此句,让发音人填充。

讲故事培训,先让发音人看几遍书上的文稿,然后用自己的语言讲述。试讲中一定不能让发音人看书。如果让发音人看书,他们在正式采录时就离不开文本。可以让发音人在训练前列个提纲。

话题讲述在培训中,主要让发音人理清头绪,确定要讲几个方面的内容。发音人常常觉得一个人独自讲20多分钟内容有点难,觉得无话可说,而且很拘谨。我们在培训中要明确地告诉发音人,话题采录主要目的是录制方言的表述,内容只要与题目有点关系即可,可以天南海北地谈,就像日常生活与朋友聊天一样。培训中,也可以让发音人列一个简单的提纲。

对话在培训中要先确定内容,然后分层次,并选定一位发音人作为话题引导者,由他引导其他三人进行对话。

5录制过程需注意事项5.1录音录音时,嘴巴要正对着话筒,才能保证录音的饱满。嘴巴与话筒的距离约为10厘米。嘴巴离话筒太近,声音清晰度下降;离话筒太远,声音虚。采录中还可能产生“扑扑”声,这是由于发音员发爆破音气流冲击话筒引起的。如出现这种情况,建议话筒套上海棉防护罩,或让发音人嘴巴稍微偏离话筒。后者虽然会影响声音的饱满度,但两害相权取其轻。根据发音人的身体状况,每录5分钟或10分钟休息一下。

录到生殖器官和两性关系以及骂人的话时,发音人一般会感到难以出口,声音变小,有的发音员可能不大愿读。工作人员就要做他们的工作,告诉他们,这是一项学术工作,是神圣的工作,让发音人用平常之心对待这些字、词、句。

语法录音,即例句录音是录音中较难的部分。因为这部分的普通话例句用方言表达在用词造句上有很大变化。

如果把普通话直译、硬译为方言也是能够读得出来的,但这样的采录质量是不行的。这部分的录制宜每一句都先说一遍,得到工作人员肯定后再采录。

地普的“规定故事”在录制中要严格按照《中国语言资源有声数据库调查手册———汉语方言》的要求“讲述时不允许看文本”,如果允许看文本,发音员就会不自觉地把文本一读到底,也就达不到本题要了解方言普通话字、词、句的目的。“朗读”部分不允许发音人查字典,但发音人可能会遇到不认得或发音没有把握的字,这时工作人员一定不能把字音告诉发音人,只能把字的意思告知发音人,如果发音人还是不会读,只能告诉发音人,他觉得该怎么读就怎么读。

5.2摄像摄像既要考虑图像的清晰,又要保证声音干净。

淤摄像前要先调白平衡,不然颜色会出现偏差。

于四人的场景,即对话场景安排要注意既要方便四人对话,还要让四个发音人面对镜头。总的要求是,四人对话是为了让观众看和听的,不是他们私下在聊的。可以这样安排。

盂规定故事和自选话题为单人摄像,有些发音人觉得自己一个人说话不自在,因此,摄像人员要在摄制的同时通过神情与发音人交流。

老女——青女老男——青男榆《中国语言资源有声数据库调查手册———汉语方言》要求视频输出格式为MPEG2(720*576,6Mbps,*.mpg)。

*.mpg意思是文件后缀名为mpg。目前,硬盘摄像机几乎没有mpg格式的,都需要进行格式转换。建议使用格式工厂(FormatFactory)软件进行格式转换。

在课题的运作中,我们边学习、边工作,终于摸索出一套建立方言语料库的方法。通过做课题,我们感到,要做好建立方言语料库的工作,必须把《中国语言资源有声数据库调查手册———汉语方言》读透,还要向已经做过这项工作的地方学习,自己更要不断实验。

建立方言语料库是一项跨学科的综合性的工作,需要方言学方面的专家,也需要能进行记音、录音、摄像方面的专门人员。通过本项工作,将培养一批方言学和计算语言学等方面的专家、行家。

本项工作是理论性和操作性并重的工作,它将让一批语言学者走出书斋,进入丰富的、鲜活的语料中,从而为理论研究注入新的生机。

本项工作不只是学术界的事,它向社会释放一个信号:中华文化博大精深,应得到保护和发展。

参考文献院[1]卢芸.百年建瓯方言研究综述[J].华西语文学刊,2011(01).[2]李如龙.闽南方言地区的语言生活[J].语文研究,1995(02).[3]吴晓芳.评《闽南方言大词典》[J].闽台文化交流,2007(02).基金项目院本文为福建省教育厅课题文章。课题名称:福建省教育厅A类社会科学研究项目,课题号是JA12554S。

作者简介院王勇卫(1967-),男,江苏泗水人,副教授,语言学及应用语学硕士,从事语言学教学和研究工作。

标签:;  ;  ;  

试论福建省方言有声语言资源数据库的建设
下载Doc文档

猜你喜欢