人工智能机器学习的著作权合理使用制度研究
张赵友
江南大学法学院 江苏 无锡 214122
一、引言
在人工智能技术迅猛发展的时代背景下, 广泛应用已深入日常生活的方方面面,其中尤以人工智能与机器学习技术的融合应用最为显著。 音乐等诸多领域进行创作。机器学习作为人工智能的主要分支, 说首次以机械化生产为主导的技术革新将人类从沉重体力劳动中抽离, 动的大幅解放,或将引发生产与生活方式的深刻变革。然而,伴随这些转变 人类与人工智能间衍生的法律关联及伦理议题逐渐浮出水面。因此,必须审慎应对人工智能技术的潜在风险,构建并完善适配的监管机制。
在我国,现行立法对人工智能创作物的著作权问题尚存空白,但实际应用中,人工智能创作的作品已屡见不鲜且呈增长趋势。我国需借鉴国际经验, 能创作物的著作权合理使用制度,这既有助于激励技术创新、维护著作权人合法权益,也利于维 保护消费者利益。在人工智能机器学习技术发展中,原创性与知识产权保护的重要性日益凸显,著作权合理使用面临的挑战与争议也亟待深入研究。
二、人工智能机器学习作品合理使用概述(一)人工智能机器学习的概念与工作原理
2023 年4 月11 日,国家互联网信息办公室发布的《生成式人工智能服务管理办法(征求意见稿)》明确界定:生成式人工智能是依托算法、模型与规则,以生成文本、图片、声音等多种形式内容为核心的技术。“机器学习是综合运用数学、统计学、计算机科学等知识设计的优化算法”,本质是利用海量数据训练模型,使模型独立完成预测与决策任务,过程中算法持续调整模型参数与结构,以最小化预测误差、提升准确性。其工作原理分为输入、学习、输出三大阶段。
输入阶段,人工智能系统吸收大量服务对象相关数据并储存副本,为后续学习奠基。学习阶段,通过深度分析数据文本发掘共性、构建数学模型,实现模拟创作。输出阶段,依据服务对象目标生成相应作品。以新闻媒体的AI写作稿件系统为例,创作前期收集大量新闻稿件输入,分析常用词句、逻辑关系及写作手法等并优化,按预设程序训练创作,最终生成稿件发布。可见,机器学习是复杂且高效的运行过程。
(二)人工智能机器学习的著作权保
1.人工智能机器学习对作品的获取
数据获取是人工智能机器学习的关键环节,数据多来源于文学、艺术、科学等领域的已存作品,含公开发表与未发表两类。人工智能系统通常通过爬虫技术、数据挖掘等从互联网或其他数据源获取数据,此过程可能涉及原作品的复制和传输。对获取过程中的著作权问题,需从两方面分析。
对于公开发表的作品,著作权保护明确,未经许可不得擅自复制、发行、传播或利用。人工智能系统通过爬虫等方式获取时,须符合著作权法规定,保护著作权人权益。对于未发表的作品,著作权保护更复杂,著作权人可能不愿其传播或利用,获取时需格外谨慎,避免侵权。
2.人工智能机器学习对作品的利用
人工智能机器学习对作品的应用体现为数据的深入分析与精确学习,系统提取数据特征和规律,用于模型训练优化。此过程类似人类学习创作,但具特殊性,如可借大数据和算法优势发现人类难察的规律趋势。依据数据分析是否涵盖作品独创性表达,可分为“表达性使用”与“非表达性使用”。
“表达性使用”中,可对作品改编演绎,通过学习海量有著作权的作品,产生风格相似或相同的产品,凡机器学习过程中使用有著作权作品表述的均属此类。其关键在于系统是否直接使用受保护作品的表达形式,若生成新内容时直接借鉴或复制已有作品的独特表达(如文字风格、故事情节等),可能构成侵权。
“非表达性机器学习”的输出不基于作品的表达性运用。如图像识别领域,系统分析大量图像数据学习识别特征,实现自动分类识别,过程中未直接利用图像独创性表达,而是提取分析特征。这种利用方式在机器学习中普遍,更关注数据特征规律而非表达形式。
(三)人工智能机器学习适用合理使用制度的困境
1.人工智能机器学习对合理使用制度的冲击
著作权法旨在平衡公共利益与专有权利、调和知识共享与权利独占,合理使用规则是重要制度,允许特定情况下无需授权使用受版权保护作品,以平衡著作权人利益与公众信息需求。人工智能机器学习应用中亦需处理此平衡问题。若著作权法过度侧重保护专有权利,将给机器学习带来挑战。故按机器学习利用方式差异分别探讨,以发挥合理使用制度的正面作用。
(1)非表达性机器学习无需援引合理使用制度
非表达性机器学习关注数据特征规律而非表达形式,不直接利用作品独创性表达,无需援引合理使用制度。其使用的数据多公开可用,分析结果通常不涉及原作品复制传播,从著作权法角度不构成侵权。
因此,非表达性机器学习无需过度关注合理使用问题,关键是确保数据合法合规,尊重来源与权益,技术公司加强内部管理规避法律风险。但并非可随意使用数据,涉及个人隐私、商业秘密等敏感信息时,仍需遵守法律法规与道德规范,保障数据合法安全。
(2)严格普通的表达性机器学习
常规表达性机器学习直接运用作品独创性表达,系统学习分析已有作品表达模式,衍生新内容或改编演绎。普通表达型机器学习的算法学习素材涵盖各类不特定作品,如ChatGPT、文心一言等系统以网络论文、期刊等为语料库训练,生成论文写作模块,通过双向语言模型扩展句子、检查文章流畅连贯度,输出符合需求的论文。
但此类机器学习常面临著作权侵权风险,因学习和生成内容过程中难免借鉴复制已有作品表达形式,可能构成侵权。故如何确保普通表达性机器学习合法合规创作,成为亟待解决的问题。
2.人工智能机器学习无法适用著作权合理使用条款
我国著作权法以封闭形式列举12 种合理使用情形,2020 年11 月修订的新《著作权法》虽有调整,但未明确以发展人工智能优化算法为目的 属何种情形。 《著作权法》第24 条部分条款内容未变,部分新增作品使用规范 、少量复制已发表作品供内部使用,禁止出版发行),但机器学习 性质,不符合科研目的权利限制;第一款第八项文化遗产机构复制作品的 不符,且主体范围过窄。其余条款亦无法反映机器学习作品使用的真实情况。以下两项条款是学界重点分析的立法空白体现。
(1)个人使用类型主体和目的条件不符
我国《著作权法》第 24 条第1 款第 1 项允许个人为学习、研究或欣赏目的合理使用他人已发表作品,但有局限。首先,主体仅限“个人”,而人工智能开发需团队协同,个人难以胜任;其次,目的限于“学习、研究或欣赏”,但人工智能应用常带商业性质,与之相悖。人工智能由算法系统控制,非基于人类思想情感,其生成内容难归入个人合理使用范畴。
此外,人工智能训练者不符合个人使用条件,仅为辅助者,且人工智能渐具类生物意识特性,人类难预测其生成结果、直接干预。随着自主性提升,人工智能可自主搜集数据学习,训练者不直接参与过程,生成作品亦非其智力成果,故其创作活动无法归属于“个人”主体范畴。
从个人使用目的看,《著作权法》第二十四条第一款第六项允许为科学研究合理使用已公开发表作品,但需服务公共利益,仅非商业性科研可合法抗辩,商业性科研不可援引。因此,人工智能领域的机器学习行为不适用传统个人使用范畴。
(2)兜底性条款无法适用
2020 年新《著作权法》第24 条新增“法律、行政法规规定的其他情形”的兜底性条款,使合理使用制度从封闭转向开放,增添弹性与灵活性,看似为机器学习提供权利例外与限制空间。但该条款模糊且缺乏详细规定,难以满足机器学习复杂权利关系需求。
首先,《著作权法》《信息网络传播权保护条例》对“合理使用”有具体规定,无其他法律法规明确时,无法直接适用。其次,人工智能作为新兴技术领域,权利关系和属性不确定 兜底性条款的模糊性无法提供有力法律支撑,在指引新技术适用合理使用制度上缺乏操作性。 综上 机器 足12 种合理使用情形,亦难纳入新《著作权法》相关宽泛规定,因法律法规缺失,兜底性条款难以发挥作用,无法应对深度学习机制应用带来的挑
战。
三.我国机器学习适用合理使用制度的完善路径(一)人工智能机器学习合理使用制度的重构
1.附加“合法获取”要件
重构合理使用制度时,将“合法获取”确立为核心要件,对保障机器学习所用数据、文本、图像等素材的正当性至关重要,既维护原创作者权益,又促进技术稳健发展。制定“合法获取”具体标准时,需考虑技术进步带来的数据获取方式变化,确保标准具前瞻性且适配现实需求。还需通过法律解释、案例指导等明确其内涵与适用范围,为司法实践提供指引。
2.采用机器学习“计算机分析”合理使用的例外
人工智能技术在数字内容生产领域的广泛应用催生新型著作权侵权关系,我国现行合理使用制度难以应对。虽“兜底性条款”提供一定灵活性,但面对机器学习仍显不足。需在机器学习这一全新认知范式下,探索建立适配的社会契约。
美国“转换性使用”规则为司法判例中机器学习合理使用提供认定依据,但因我国成文法与美国判例法模式差异,难以适用。英、欧盟在文本与数据挖掘方面的立法依赖数据库立法保护,我国尚无此类立法,过严立法可能制约人工智能发展。日本“计算机分析例外模式”制度设计中立,借鉴美国转换性理论,允许为提供新知识或信息的使用,可行性强。
综上,借鉴日本立法经验,增设“计算机分析”例外条款更符合我国实际,为人工智能发展提供可靠路径。明确立法用语后,可借鉴美、欧盟等的具体规定,明确主体、目的、储存等要件,构建我国机器学习合理使用的本土化制度,平衡著作权保护与技术创新,推动人工智能在数字内容生产领域健康发展。
(二)增设机器学习利用作品合理使用的具体情
1.不对使用主体与使用目的进行限制
“合理使用”是基于著作权法的“无偿使用”制度,旨在均衡保护著作权人权利与公众作品使用权。理论上,未经许可且营利性使用他人作品不应纳入合理使用范畴,但现实中从事人工智能研发的企业多为营利性,大型AI公司研发能力堪比研究机构,是技术发展中坚力量。故应规制“无商业用途”的适用前提,确保其在人工智能领域的优势地位。同时,免责条款适用不应局限于科研、教育等特定组织,应扩大至所有从事计算机分析的组织和公司,保障公平竞争,促进科技创新。
2.修订著作权法增设机器学习利用作品合理使用具体情形
2020 年修订的《著作权法》第二十四条第一款前十二项合理使用列举大体保留原有规定,未针对新技术下作品使用需求补充。第十三项“法律、行政法规规定的 体规定,无法为高新技术领域新型合理使用行为提供指导。鉴于大数据背景下人 智能机 自由使用的新需求,需通过法律或行政法规明确人工智能领域的合理使用情形。在其他法 应依《著作权法》第24 条确定合理使用范围,个案中即使新作品使用模式可能被列入“合理 法律情况的相似性,不得让法官任意创造无关联新适用模式。
(三)统一人工智能机器学习合理使用裁判标准
人工智能和机器学习技术的飞速发展拓宽了应用领域,但也带来合理使用的争议与挑战,确立统一裁判标准尤为迫切。立法上需将机器学习纳入合理使用范畴,司法上更需明确适用裁判标准,避免同案不同判,维护法律稳定性与权威性。
1.坚持“三步检验法”
为应对数据时代人工智能对著作权制度的挑战,各国探索更灵活的裁判准则以平衡多方利益。“三步检验法”因相对抽象成为核心议题,我国新《著作权法》已将其确立为法定判断基准,实现著作权领域各方利益平衡,应予以坚持。
此外,我国作为《伯尔尼公约》及相关国际贸易协定缔约方,需遵守协定中关于“三步检验法”的规定。“三步检验法”是对著作权“限制的限制”,规范著作权限制与例外制度,既可适用于法定情形,又具创设新例外的功能,是法定情形无法适用时的灵活条款与最终准则。
司法实践中,运用“三步检验法”检验机器学习是否构成合理使用,需注意:即使符合第一步法定情形构成合理使用,仍需接受后两步检验;不可忽略第一步直接用后两步判断,明确符合法定情形时,不可仅依赖一般条款解释,避免法律僵化。
2.辅之以“四要素”标准
“三步检验法”较抽象,实际操作中对第二步“不影响作品正常使用”和第三步“不损害原著作权人合法权益”的判断存在理解差异与标准不确定性。引入合理使用“ 四要素”分析法可提供更精确依据,理论上二者均致力于平衡著作权人私有利益与文化传播公共利益,我国司法实践已有运用“四要素”作为辅助标准的经验,故坚持“三步检验法”的同时结合“四要素”分析切实可行。
具体操作中,可借“四要素”的“使用行为对原作品市场价值的影响程度”解读“三步检验法”第二步;依据“四要素”的使用行为目的与性质、是否具商业性、被使用作品性质与数量解读第三步,增强强制力,为司法裁判提供明确统一准则。
3.设置开放式的人工智能机器学习评判标准
当前司法实践中,我国各级法院运用合理使用规则的路径方法不同,导致判决结果不统一。研究各法院相关裁决发现,其法律适用逻辑与判断标准存在分歧。因现行合理使用制度缺乏统一明确的判定标准,部分法院坚持传统封闭式标准,部分借鉴国外法律概念创新。
因此,急需统一各级法院在合理使用法律条文应用逻辑和判决标准上的认识。首先,明确法律适用逻辑顺序:先判断被诉使用行为是否属合理使用具体情形,均不适用则考虑领域指向性一般条款,最后依三步检验法验证是否构成合理使用。其次,统一判决标准:严格遵循我国法律规定,避免照搬国外法律创设新合理使用情形。
判断人工智能领域合理使用具体情形时,对“必要范围内”“轻微利用”等概念建立公平普适标准供各级法院参考。及时发布相关指导性案