AI 生成的著作权侵权实务法律适用难点与规制建议
杨仲凯
上海中联(天津)律师事务所 300121
在现行的著作权法体系中,合理使用制度、作品性质的判定以及权利归属的规则尚不能妥善处理当前生成式人工智能应用所引发的争议。在数据输入阶段著作权法应明确界定合理使用的界限和侵权责任的归属。而在输出阶段,著作权法需明确指出对人工智能创作成果的保护范围。笔者深入研究了欧盟的立法案例,认为这对于完善我国的著作权法律体系,以及探索人工智能领域的立法规范具有重要的意义。
一、现阶段人工智能著作权侵权问题
(一)输入端数据训练的合理使用问题
在数据输入阶段训练数据的使用涵盖数据收集、数据预处理等。首先,人工智能研发者为收集数据,会将相关训练作品复制或下载至自有或第三方服务器中以便使用。这一过程属于著作权法中所指的数字化复制行为,可能侵犯复制权。无论采用何种数据获取途径,核心争议在于未经权利人许可而抓取信息用于人工智能创作过程。争议焦点集中在著作权权利人与大模型公司之间。这不仅是一个理论问题,在现实中已有众多案例。然而,由于基础模型的训练数据集规模庞大、来源广泛,开发者在训练前难以识别数据的版权归属并获得许可。可见,事前许可机制与生成式人工智能技术发展之间存在难以逾越的现实鸿沟。在人工智能数据训练阶段,打开著作权合理使用和避风港规则的闸口,成为开拓生成式人工智能产业创新发展的新路径。
在立法层面,现行《著作权法》第四节权利的限制项下第 24 条关于合理使用的规定及第 25 条关于法定许可的规定均无法精确涵盖大模型训练这一领域。司法层面,《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》第八条规定:在促进技术创新和商业发展确有必要的特殊情形下,考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素,如果该使用行为既不与作品的正常使用相冲突,也不至于不合理地损害作者的正当利益,可以认定为合理使用。
笔者认为,可以适当拓宽著作权合理使用的解释范围,将生成式人工智能的数据预训练行为视为合理使用的一种类型。生成式人工智能进行数据训练的过程可类比为人类的学习过程,仅需考察输出结果是否构成侵权。在此过程中,对数据的分析和学习仅在人工智能内部进行并不产生与创作者竞争的内容,也不触及其他公众的权益,因此不会对著作权人的作品产生替代效果不应受到传统著作权法的限制。
(二)输出端内容著作权保护范围问题
生成式人工智能作品是否具有可版权性,涉及著作权法上独创性的认定。目前,判断人工智能生成物是否具有独创性,有以下两个标准:分别是以作者为中心的主观主义标准和客观主义标准。持主观主义标准的学者认为,机器不属于受法律保护的主体,这与著作权法的规定相一致。持客观主义标准的学者则认为,著作权中独创性判断的核心在于作品内容本身是否能满足公众需求,而不是其创作过程如何,仅需判断作品内容是否满足最低限度的创造。对独创性的判断,仅需考虑人工智能生成内容的表达本身,无需考虑创作过程中是否包含思想和人格。
笔者认为,人工智能生成作品具有可版权性,因为人工智能的本质是大量人类智力劳动的体现,算法只是辅助创作的工具。研发者设计运算模型,设定原始参数和运算逻辑,甚至操控特定的训练方向。使用者采用精准、间接的提示词提问,不断调试直至输出预期标准的成果。在这一过程中,人类的介入起到了关键作用。
二、对人工智能著作权问题的欧盟经验
早在 2019 年,欧盟通过《数字化单一市场版权指令》为人工智能文本和数据挖掘的合理使用情形提供豁免,为技术发展开辟绿色通道。《指令》第 3 条规定了以科学研究为目的的文本和数据挖掘;第4 条规定了文本和数据挖掘的例外或限制:以“文本和数据挖掘”为目的,对合法获取的作品或其他内容进行复制和提取的行为进行豁免。第 4 条的适用情形不限制主体和非营利目的,表明欧盟默示许可该条款适用于商业产品开发中,而该条款的限制条件是权利人没有以适当方式保留对上述作品或其他内容的使用。与对此问题进行法律规制的其他国家相比,欧盟显得较为保守。
欧盟《人工智能法》第 53 条规定了通用人工智能模型提供者的著作权合规义务,特别是用于训练模型的主要训练数据集合的披露义务。欧盟通过人工智能法案,在适用于所有等级的人工智能系统的普遍原则中规定了透明度原则,即人工智能系统的开发和使用方式应允许适当的可追溯性和可解释性,同时应使用户意识到他们与人工智能系统的交流与互动,并适当告知用户该人工智能系统的能力、限制和对其权利的可能影响。同时,法案为不同风险等级的人工智能设定了不同程度的义务。基础模型提供者将模型专门用于生成式人工智能时,基础模型提供者应当履行透明度义务,采取足够的保障措施防止产生违反欧盟法律的内容;在不影响国家或欧盟版权立法的情况下,记录并公开提供受版权法保护的训练数据使用情况的详细摘要。此外,高风险人工智能系统的进口者应按规定履行信息披露以及与主管部门合作的义务。
三、我国人工智能著作权侵权的法律治理展望
服务提供者必须在法律框架内进行预训练和优化训练等训练数据处理活动。同时,必须尊重知识产权、尊重他人合法权益,并根据服务的具体类型采取适当措施来增强人工智能服务的透明度。此外,服务提供者还需对人工智能生成的内容进行明确标识。中国作为全球人工智能技术发展的重要参与者,正积极探索适应人工智能时代的知识产权治理模式,努力平衡著作权权利人、大规模经营者和社会公共利益的权利要求,鼓励多方参与,建立综合、平衡、适应性强的人工智能知识产权治理体系。
结语:科技发展推动立法科学化、精细化,增强法律条文的实用性和可操作性,以此有效应对日新月异的社会需求。同时,法律作为社会行为的规范与指南,是科技领域明确的规则框架与秩序基础。人工智能在赋能社会经济发展的同时,其背后的风险问题也给现有的法律框架带来不小的挑战。这要求我们在享受科技红利的同时,必须构建完善的法律机制与监管体系,以平衡技术进步与社会稳定、个人权益之间的关系,确保人工智能的健康发展能够真正惠及全人类。生成式人工智能知识产权问题的解决,关键在于完善著作权法,既要合理划定数据使用的边界,减少侵权风险,又要积极探索并确立人工智能的著作权保护机制,为技术创新与文化产业繁荣提供坚实的法律支撑。
参考文献:
[1] 王迁:《生成式人工智能与版权保护》,载《中国法学》2023年第3 期
[2] 崔国斌:《生成式 AI 版权侵权的比较法观察与中国应对 ——以欧盟《人工智能法案》与美国版权局新规为参照》,载《中外法学》2023 年第 5 期