数字之治:生成式人工智能数据生产的法治审思
傅新皓 李满春
中南大学 马克思主义学院 湖南长沙 410083 中南大学 法学院 湖南长沙 410083
习近平总书记在中共中央政治局第九次集体学习时强调:“要加强人工智能发展的潜在风险研判和防范,维护人民利益和国家安全,确保人工智能安全、可靠、可控。”[1] 生成式人工智能的数据生产正在重塑社会治理的技术基础与法治形态,其法治化进程既面临技术逻辑与权利体系的结构性矛盾。以逻辑解构揭示困境本质,以规范检视明确制度短板,以路径重构构建治理框架,是数字时代法治建设的重要使命。
一、生成式人工智能数据生产的逻辑解构与法治困境
(一)数据生产的技术逻辑与权利冲突的本源追问
马克思主义实践哲学认为,数据生产作为一种社会物质实践活动,其权利关系本质是生产关系的数字化投射。[2] 生成式人工智能通过算法重构数据生产资料的占有方式,使得数据生产者、使用者与所有者的界限趋于模糊。从技术属性看,生成式模型对训练数据的依赖具有非竞争性与非排他性特征,单一数据样本可能同时嵌入多个权利主体的利益诉求,涵盖自然人的隐私权、企业的商业秘密与公共数据的使用权,导致权利冲突呈现“多维度叠加”态势。这种技术逻辑与权利体系的错位,构成了数据生产法治化的本源矛盾。
(二)数据生产链的权责弥散性与法律归因困境
生成式人工智能的数据生产链包含数据采集、模型训练、内容生成、流通使用等多个环节,涉及数据爬取方、模型研发者、服务提供者及终端用户等多元主体。各环节的权责分配呈现“技术黑箱”下的弥散性特征,数据爬取环节可能存在来源合法性瑕疵,模型训练环节涉及算法偏见的潜在风险,内容生成环节可能产生侵权。当生成内容引发著作权纠纷或名誉权侵权时,难以确定责任主体是模型开发者、训练数据提供者还是终端用户。同时,数据生产的跨域性与实时性导致监管权能分散,网信、市场监管、知识产权等部门的权责边界不清,进一步加剧了法律归因的实践困境。
(三)数据生产的公共性边界模糊与治理失效风险
生成式人工智能的数据生产兼具私益性与公共性双重属性。一方面,企业通过数据生产获取商业利益,形成数据垄断的市场格局;另一方面,公共数据的社会化生产与使用关涉公共利益。但现行法律体系尚未明确数据公共性与私益性的划分标准,导致公共数据被过度商业化利用,而私人数据的公共价值难以有效释放。从治理实践看,数据生产的公共性边界模糊可能引发算法偏见导致的数据歧视、公共数据资源的私人占有、跨境数据流动中的公共利益受损等风险。因此,亟需构建新型法治治理框架。
二、生成式人工智能数据生产的法律框架检视与规范缺失
(一)现行法律体系对数据生产行为的规制滞后性
我国现行法律体系构成数据治理的基本框架,但对生成式人工智能数据生产的针对性规制明显不足。比较法视野下,欧盟《人工智能法案》将生成式 AI 纳入“高风险系统”监管,要求开发者履行数据质量与透明度义务,但未解决训练数据的权属问题;美国通过行业自律与判例法结合的方式规制数据生产,但其分散化模式难以应对跨州数据流动的挑战。这种规制滞后性的根源在于,生成式人工智能的数据生产速度远超法律修订周期,技术迭代与制度演进的时间差导致法律供给与实践需求之间的结构性失衡。
(二)数据权属界定的模糊性对生产秩序的深层影响
数据权属界定是规范数据生产秩序的逻辑前提,但生成式人工智能的数据权属呈现“三重模糊性”。一是原始训练数据的权属分割;二是模型参数化数据的权利归属;三是生成内容的知识产权认定。《民法典》仅原则性规定“数据、网络虚拟财产的保护”,未明确权属划分规则;《著作权法》将作品定义为“人类智力成果”,直接排除 AI 生成内容的著作权主体资格,但实践中大量AI 生成内容已进入市场流通,形成“法律空白区”。权属模糊性导致数据生产陷入“公地悲剧”,企业过度攫取公共数据资源而缺乏保护激励,个体数据权利被技术优势方侵蚀,最终破坏数据生产的可持续秩序。
三、生成式人工智能数据生产的法治路径重构与治理现代化
(一)数据生产法治化的核心原则:安全与发展平衡的制度设计
欧盟与美国的人工智能战略政策为我国提供治理理路参照。[3] 生成式人工智能数据生产的法治化需确立“安全与发展平衡”的核心原则,构建“促进型规制”框架。可将数据生产分为高风险领域、中风险领域与低风险领域,实行差异化监管:高风险领域适用“预防性规制”,要求数据来源可追溯、生成过程可审计;低风险领域适用“激励性规制”,通过税收优惠、知识产权保护等政策鼓励创新。需建立数据生产合规沙盒机制、安全评估与创新激励的联动机制以及技术标准与法律规范的协同机制,实现“技术自律”与“法律他律”的有机融合。
(二)多元共治框架下数据生产的协同治理机制构建
生成式人工智能的数据生产治理需构建“政府—企业—社会”多元共治体系。政府层面应强化统筹协调,建立数据生产跨部门监管联席会议制度,解决监管权分散问题;企业层面需落实主体责任,建立数据生产全流程合规体系,公开训练数据来源与权属处理方案;社会层面应发挥第三方机构作用,鼓励行业协会制定自律公约,支持学术机构开展算法审计与风险评估。必须确立层次分明的价值对齐标准,明晰权责统一的价值对齐性质 [4],特别需要建立数据生产的利益相关方协商机制。在公共数据生产领域,由政府、科研机构、企业代表组成委员会,决定数据开放范围与使用条件;在商业数据生产领域,通过集体协商确定数据收益分配比例。
参考文献:
[1] 经济日报 . 抓住新一轮科技和产业革命的“领头雁”[EB/OL]. (2018-12-08)[2024-05-12].https://www.gov.cn/xinwen/2018-12/08/ content_5346910.htm.
[2] 程萌 . 实践哲学、“文化领导权”与马克思主义中国化——兼论构建自主性知识体系 [J]. 马克思主义哲学研究 ,2025,(01):26-34+363-364 .
[3] 王迪 , 戴思源 .“主题 - 工具 - 效力”三维框架下欧盟与美国人工智能战略政策的比较分析研究 [J/OL]. 智库理论与践 ,1-12.http://kns.cnki.net/kcms/detail/10.1413.N.20250728.1026.004.html.
[4] 郑煌杰 . 人工智能大模型价值对齐的协同进路 [J]. 江西财经大学学报 ,2025,(04):112-123.
基金项目:本文系国家社科基金项目“中国现代化进程中共同富裕研究”(21BKS136)和研究生自主探索创新项目“智能传播场域社会主义意识形态引领力生成机理研究”(2025ZZTS0247)的阶段性成果。