中国语言资源保护工程
2015年开始启动的工程
为推广和规范使用国家通用语言文字,科学保护各民族语言文字,中国2015年启动中国语言资源保护工程,目前已按计划完成81个少数民族语言(含濒危语言)调查点、53个汉语方言(含濒危方言)调查点和32个语言文化调查点的工作任务。
2018年9月19日,教育部副部长、国家语委主任杜占元在长沙市举办的首届世界语言资源保护大会上介绍,“中国语言资源保护工程”计划田野调查1500个地点,目前已经完成总体规划的2/3,各项标志性成果正陆续推出。
介绍
中国语言资源有声数据库是国家语言资源建设工程之一,它用现代信息技术采录语言数据,经转写、标记等加工程序将相关的文本文件、音频文件及视频文件整理入库,以数据库、互联网、博物馆、语言实验室等形式向学界和社会提供服务。
汉语部分
根据《中国语言资源有声数据库调查手册》,中国语言资源有声数据库(汉语)部分设计为:
一、语言和方言调查
1.调查点:根据县级行政单位设置调查点,原则上“一县一点”,特殊情况下可以增点或减点。本调查重在反映当下语言的实态,因此调查点选择县城等在当地影响较大的地方。
2.调查对象:每个调查点根据性别因素和年龄因素选择有代表性的4名发音合作人,其中男女各2人,老年青年各2人。
3.调查内容:调查内容分语言结构调查和话语调查两大部分。
语言结构调查是基础,用1000字调查语音系统,用1200词调查基本词汇系统,用50个句子调查主要的语法现象。
话语调查是重点,分为讲述和对话两部分。讲述包括“规定故事”和“自选话题”。规定故事为《牛郎和织女》
4.调查方法:采用规定的录音设备、软件进行录音,辅之以录像和照片。并且,对调查内容还要按照一定要求进行必要的国际音标转写和汉字转写。最后,对一个调查点的所有调查资料和电子文件进行命名、分类、归档。
5.建库:国家组织专人进行验收,将调查材料统一建档入库。并及时组织专家对数据库进行开发。
二、“地方普通话”调查
地方普通话调查与语言和方言调查一同进行。其选点要求也与语言和方言的调查相同,原则上是一县一点。每调查点选择3名发音合作人,这3名发音合作人的普通话水平处在不同的等级:1名相当于《普通话水平测试等级标准》 规定的三级甲等,1名仅次于三级乙等,1名普通话水平最差,接近方言。
地方普通话的调查内容是:1、用普通话讲述规定故事《牛郎和织女》;2、用汉语朗读两篇短文《诚实与信任》《大学生村官》。调查得到的音频文件等经整理验收,建档入库,形成地方普通话语料库。
地方普通话语料库是中国语言资源有声数据库的一个分库。
工程进展
2015年,语保工程启动。
2019年,为期5年的语保工程一期建设顺利完成,调查收集到123种语言和全国各地方言的原始语料数据1000多万条,其中音视频数据各500多万条,总容量达100TB。
2021年4月19日从教育部获悉,中国语言资源保护工程正式启动二期建设,在大力推广国家通用语言文字的同时,科学保护好汉语方言和少数民族语言资源,促进语言资源的开发利用。
目录
概述
介绍
汉语部分
工程进展
参考资料