我国英语语料库的版权保护论文

作者:网友分享原创网站原创 点赞:18486 浏览:82396 最后更新时间:2024-01-22
摘要:我国的英语语料库建设在进入21世纪后发展迅猛,建成了大型的英语语料库。笔者调查发现,这些语料库并没有被广泛使用,版权保护法律体系的不完善和语料库公众共享的困难是主要理由。因此,构建由《著作权法》《反不正当竞争法》及其他特殊的法律保护措施组成的多重法律体系,势在必行,只有这样才能更好地为语料库版权提供保护,并为公众合法使用语料库提供法律保障。
  关键词:英语语料库 版权保护 数据库 知识产权
  语料库巨大的应用空间和潜力使得语料库语言学的研究策略是当代语言学的主流范式之一,它被广泛应用于语言研究和教材及词典编写等应用领域。从20世纪末到现在的这十几年中,我国建设了为数众多的大型英语语料库、一批小型自建语料库以及大量在线电子语料库和各种网络传播的网络语料库。这些语料库是否很好地怎么写作了我国的英语研究和英语教学活动的开展,语料库的版权保护和公众的共享使用是否达到了平衡等理由值得深入研究,本文从我国英语语料库版权保护这一法学研究视角来探讨这一理由。
  

一、我国英语语料库的目前状况

  肯尼迪在《语料库语言学入门》一书中把语料库定义为“书面文本或转写成书面文本的口语材料的集合,用作语言分析和描写的基础”。[1]杨惠中教授主编的《语料库语言学导论》中把语料库定义为“按照一定的语言学规则,运用随机抽样策略,收集自然出现的连续的语言运用文本或话语片断而建成的具有一定容量的大型电子文库”。[2]从这两个定义可以看出,语料库从本质上而言是一种用于语言研究的特别的电子数据库。最早的语料库可追溯到18世纪,是西方为编撰词典而手工方式收集的反映真实语言使用的文本,收集方式费时低效,发展缓慢,不成规模。直到20世纪50年代后期,在计算机技术的推动下,语料库才逐渐发展起来。
  20世纪80年代,语言学研究范式的转变及微型计算机技术的发展使得语料库的建设出现了空前繁荣的局面。在国外,多个大型语料库建设成功,如LOB、BCET、赫尔辛基历史英语语料库、BNC、BoE等大型语料库的建立和不断扩容;在国内,1986年我国第一个科技英语计算机语料库JDEST建成。1999年大学英语学习者语料库的建成,中国有了第一个收集本国人英语学习材料的语料库CLEC。该库不断扩容,收集了不同层次的中国英语学习者语料并由桂诗春和杨惠中于2003年编著出版,书名为《中国学习者英语语料库》。此后,中国出现了其他类型的学习者英语语料库,如收集英语专业学生作文和口试转写语料的中国学生英语口笔语语料库SWECCL1.0版和SWECCL2.0版;2008年建成的收录英语专业写作和翻译文本的英语专业语料库CEM,以及收录英语专业学生口笔译翻译文本的中国大学生英汉汉英口笔译语料库PACCEL。这些语料库具体信息可见下表1。
  此外,还有一些新建的语料库如公共英语等级考试口语语料库SECOPETS、中国英语学习者纵深口语语料库LSECCL和大学英语教材语料库COLEN等较大型英语语料库。这些语料库被广泛应用于英语教学和研究领域,在外语教学、教材编写、词典编撰等领域发挥了作用。
  

二、我国语料库版权保护的目前状况

  1. 版权保护和公众使用的矛盾。为探讨英语语料库在研究中的应用,笔者分析了2001~2010年10年期间21篇发表于《外语教学与研究》、18篇于《外语界》和19篇于《现代外语》的运用英语语料库来进行相关研究的文章后发现,基于表1中这些大规模语料库的研究相对较少,这些大型语料库的价值未能充分发挥。详见表2。
  从表2可见,表1中列出的另外三类语料库CEM、PACCEL和SWECCL 2.0并没有被用于研究。基于另外三个语料库的研究型文章共有33篇,占文章总数的57%,语料库的使用频次依次为CLEC、SWECCL 1.0和COLSEC。被分析的58篇文章中有17%的文章基于自建的语料库,可见根据教学和研究所需自建语料库有一定的应用价值。剩下26%多为介绍型文章。笔者认为,大型语料库的应用并不广泛的主要理由,是没有妥善地解决好版权保护和公众使用最大化两者之间的矛盾。因为“数据库自身的特性决定了对数据库的保护总是伴利益的冲突。对于数据库权利人而言,其希望数据库尽量周全的保护,而对于数据库使用者而言,则要求尽可能赋予数据库较少的权利保护,以避开信息垄断现象的发生。这两种要求针锋相对,在不同时期处于此消彼长的状态”。[3]为使语料库能够更好地用于研究领域,就须平衡好版权保护和公众使用两者之间的关系。
  2. 版权保护和语料库的“原创性”。为保障语料库的健康发展,妥善解决版权保护理由至关。在我国,《著作权法》是保护版权的主要法律形式,然而在我国2001年修正的最新《著作权法》中并没有对语料库数据库给出明确的定义,也没有把它们纳入受保护的产品之列。参照日本和欧盟的法律定义:数据库是“一种利用电子手段组织、存储和检索的作品或资料集合,以及数据库操作所必需的电子资料,如它的词表、索引和供获取与显示信息用的系统”[4]。很显然,语料库符合这一定义,它是一种为满足语言研究的目的按照一定的原则收集语言材料,便于计算机存储和检索分析的特别的数据库。对于数据库的知识产权保护,《与贸易有关的知识产权协议》第10条第2款规定:“数据或其他材料的汇编,无论机器可读形式还是其他形式,只要其内容的选择或安排构成智力创作,即应予以保护。这类不延及数据或材料本身的保护,不得损害数据或材料本身已有的版权。”《世界知识产权组织版权条约》第5条也有类似规定,它被认为是具有数据库保护宣言性质的条款。[5]“原创性”原则强调选材和综合编排方面的创造性,认为只有在信息的选材和编排上有特色的数据库才具有原创性。[6]可见,数据库或语料库是否属于“智力创作”,其汇编是否具有“原创性”是数据库获得知识产权保护的基本要求。
  我国《著作权法》中和数据库语料库保护有关的条目有第12条:“改编、翻译、注释、整理已有作品而产生的作品,其著作权由改编、翻译、注释、整理人享有,但行使著作权时不得侵犯原作品的著作权。”第14条:“汇编若干作品、作品的片段不构成作品的数据其他材料,对其内容的选择编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权。”可以认为,这两项条款将由版权材料、非版权材料或数据汇编而成的数据库纳入版权保护范围。条款中并没有像国际上相关法律那样,把数据库作为汇编作品的“智力创作”特性和“原创性”作为版权保护的要件之一。而事实上数据库的开发人员只会使用几种技术建构数据库,而不愿费时费力去使用创新性的编排方式,因此数据库逐渐丧失了在编排方面的独创性。