中新社南宁1月14日电 广西壮族自治区少数民族语言文字工作委员会14日介绍,广西实施民族语文抢救保护工程,目前已完成濒危语言仡佬语多罗方言的语言数据采集工作,初步形成该方言的语音数据库。
广西是中国少数民族人口最多的省区,境内生活着壮、汉、瑶、苗、侗等12个世居民族和其他44个民族成份,少数民族人口约1900万人,占总人口的37.9%。
“随着经济社会的快速发展和融合,一些少数民族语言文字的使用人口越来越少,有的甚至走向濒危,亟需保护。”广西壮族自治区民委主任、民语委主任卢献匾称。
卢献匾介绍,自2011年起,广西开展世居少数民族语言文字使用状况和广西少数民族语言濒危情况调查研究,目前已基本掌握广西民族语言文字使用现状和少数民族群众对民族语文的基本需求。
根据调研发现,广西的仡佬族多罗方言、哈给方言、俫话,瑶族的拉珈语、炯奈话、巴哼话,京语、水语,彝语,毛南语,仫佬语以及学术界仍有争议的布央语、五色话、茶洞话等都处于不同程度濒危状况。
依托国家民委“建设中国少数民族濒危语言文字数据库”试点项目,广西开展少数民族语言资源有声数据库建设试点工作,采用现代技术手段,通过真人朗读单词、词组、讲故事、日常对话等形式,实地采集并建立真实语音及其转写文本的语料库,长期保存少数民族濒危语言。
据介绍,今年,广西将对那坡白彝语和环江毛南语开展调研,实地采集真实语音并建立真实话语及其转写文本的数据库。借助社会力量研发数据库建设所需存储、检索系统,逐步建设广西少数民族语言资源数据库基础平台。
近年来,广西各地积极开展民族语言文化等非物质文化遗产收集整理工作,27个市县区开播了6种民族语广播电视节目;三江侗族自治县完成“侗文侗歌传承保护与运用研究”科技项目;环江毛南族自治县完成首部毛南语数字电影译制片《刘老庄八十二壮士》的译配工作并首映。
广西抢救民族语文建语言有声数据库
2016-01-14
来源:中国新闻网