站内搜索
关键字:
类 别: 按标题 按内容
友情链接
手机访问本站
手机扫描上方二维码即可访问本站!
语料库沙龙第十一次活动
发布时间:2016-05-03浏览人数:

      语料库研究沙龙第十一次活动于2016年4月26日下午如期在北京语言大学成功举办。

      本次沙龙的主题为“全球中介语语料库标注质量问题研讨”,由北京语言大学语言科学院李桂梅老师和二年级研究生王永星(代表4位研二同学)主讲。

      李桂梅老师指出,字标注方面的许多问题都是由于标注员疏忽造成的,标注员应细心,并应不断提高对语言现象的识别能力。在词标注方面,老师和参会的同学们就一个短语例子“和累知识”应如何标的问题展开了热烈讨论,认为别字在词标注版中应如何处理还有待进一步研究。另外,李老师还提出了标注规范可以在某些语言点上再明确一下,这样有利于标注质量的提高。王永星同学就瑞士语料的标注情况,从存在问题,原因和对策三方面做了总结汇报。在存在的问题方面,王永星指出生语料的问题有:文件名不规范,录入版语料未经校对,一些真实姓名未处理等。词性标注和句式标注存在的问题是最大的。在原因方面,她指出有主观的原因(如:标注员对标注规范不熟练,语法水平不够等)和客观原因(如:标注工具还存在问题,标注工作上手困难,一些标注规范不具体不稳定等)。最后她提出了一些解决方法,如标注员要劳逸结合,提高自己的专业知识;标注规范要言简意赅,突出重点;标注组长和组员间多进行交流等。

      张宝林老师在总结时指出,标注质量存在漏标、错标现象。原因既有标注员工作不细致的问题,也有其语言文字功底问题。有的标注员未根据原始语料对录入版语料进行校对,基础不牢,很难进行高质量的语料标注。有些问题则尚待研究,如“机不可失,时不再来”在句层面应如何标?参会的老师同学也对相关问题发表了自己的意见,进行了积极的讨论。

      本次沙龙继续采用在QQ讨论组中使用PPT演示文稿的操作方式,由北京语言大学张宝林老师主持,北语部分硕博学生也进行了积极的线上线下参与和讨论。

      语料库研究沙龙由北京语言大学“全球汉语中介语语料库建设和研究”课题组、语言科学院、语言政策与标准研究所联合举办,每月举办一期,每次活动围绕一个专题进行讨论,旨在及时、方便地开展学术交流,促进汉语中介语语料库建设与应用研究的发展。欢迎关注语料库建设与研究的专家学者和研究生同学提出自己感兴趣的论题,作为沙龙的研讨主题。

此次沙龙是本学期举办的第二次语料库沙龙活动,沿用QQ讨论组和现场文稿演示的方式,这样不仅可以集合集体的智慧,而且克服了地理位置的局限,给广大语料库建设者与爱好者提供了极好的了解与沟通互动的平台。无论身处何处,只要有兴趣,语料库沙龙都随时欢迎大家的加入。请大家密切关注我们的相关活动。

      研究沙龙网页:http://www.hanyu123.cn/html/c7/889.html

“全球汉语中介语语料库建设和研究”课题组

北京语言大学语言科学院

语言政策与标准研究所

2016.04.28

 

Produced By 大汉网络 大汉版通发布系统