汉语语料库查重吗
问:现代汉语语料库
- 答:CCL语料库
我还有北语的语料库hsk动态作文语料库
还有这个北京语言大学信息处理研究所
问:什么是语料库?
- 答:语料库中存放的是在语言的实际使用中真实出现过的语言材料。
1、语料库
是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。应用于词典编纂,语言教学,传统语言研究,自然语言处理中基于统计或实例的研究等方面。
2、语料库分类
异质的、同质的、系统的、专用的。
3、语料库特征
语料库中存放的是在语言的实际使用中真实出现过的语言材料,因此例句库通常不应算作语料库;语料库是承载语言知识的基础资源,但并不等于语言知识;真实语料需要经过加工(分析和处理),才能成为有用的资源。 - 答:百度百科上也有解释呀 不过估计您也看过了哈
我根据自己的理解用自己的话解释一下,希望能帮到您哈~
语料库就是把平常我们说话的时候的句子、一些文学作品的语句段落、报刊杂志上出现过的语句段落等等在现实生活中真实出现过的语言材料整理在一起,形成一个语料库,以便做科学研究的时候能够从中取材或者得到数据佐证。
例如我如果想写一篇关于“给力”这个词的普及性的文章,就可以到语料库中查询这个词出现的频率、用法等等。
问:如何在汉语语料库里检测或计算两个词的相关性?
- 答:如何在汉语语料库里检测或计算两个词的相关性:
在书面汉语的语言事实中,不管是"规律"还是"例外",都符合一种"统计学的规律":例如一个"双音词",表现在书面上就是两个词,而且,这两个字必然经常连在一起出现;反之,如果两个字之间不构成一个词,那么,它们一般就不会经常在一起出现
我们可以根据这个特点,找出字与字、词与词、字与词之间是否经常在一起出现的规律,也就是"字词相关性",将其推而广之,就可以发现书面汉语中的"词法"、"句法"甚至"章法"的组织与结构规律了
问:目前比较权威的汉语语料库都有哪些?
- 答:北京大学ccl语料库
北京语言大学HSK动态作文语料库
北语中介语语料库
当代北京口语语料库
国家语委现代汉语语料库 - 答:北京大学CCL语料库、国家语委的平衡语料库
- 答:《康熙字典》,《百科全书》
问:什么是“语料库语言学
- 答:语料库语言学以语料库为手段研究语言 ,是一门独具特色的语言研究学科。语料库是大量可用计算机处理的语料的集合。
本文来源: https://www.lw50.cn/article/f0b4778131ed3d4b99b2702b.html