点击蓝字关注
了解更多精彩
(点击查看思维导图)
GB/T 7714-2015
CITE
袁真富,夏子轩.机器学习中作品利用的著作权补偿金制度研究[J].科技与出版,2024(7):28-36.
摘 要
在ChatGPT等生成式人工智能的助推下,机器学习开启了超大规模预训练的浪潮。在机器学习的数据训练等场景中,作品素材的巨量使用导致权利许可机制失灵、单个作品的微量使用导致侵权判定机制失灵、作品资源的隐蔽使用导致侵权举证机制失灵、AI内容的海量输出导致创作激励机制失灵。作为一种利益平衡机制,著作权补偿金制度基于作品整体利用的共同价值回应,将适当恢复受到AIGC挤压的人类作者利益,并通过呼应权利弱化和利益分享理论,继续给予人类作者的有限垄断激励。相较于集体管理、法定许可等解决方案,补偿金制度回避了侵权判断难题、省略了许可谈判程序、解决了使用费分配难题、避免了使用费堆叠问题,且不影响专有权独立行使。在补偿金制度本土化过程中,可以从厘清支付补偿金的义务主体、明确补偿金的法定征收主体、采取比例费率的征收标准、确立面向公共利益的使用机制等方面构建适应AIGC时代的补偿金制度。
关键词
生成式人工智能;机器学习;著作权;补偿金制度
在人工智能浪潮的席卷之下,ChatGPT、 Sora等生成式人工智能(AI)产品横空出世。在这些生成式AI的助推下,AIGC(AI Generated Content,即人工智能算法生成内容)时代正式到来。但AIGC并非平地起高楼,作为人工智能的重要组成和实现途径,机器学习基于数据和算法实现预测和分类等功能,需要海量的甚至高质量的数据资源进行训练。2020年5月发布的GPT-3的预训练数据量即高达45TB,相比GPT-1增长了近 9倍,ChatGPT-4更是远甚于此,开启了超大规模预训练的浪潮。
机器学习中数据利用的合法性问题,广泛地牵涉到个人信息、隐私、姓名、肖像、商业秘密等人格权和知识产权风险,但本文聚焦于其中作品利用的著作权侵权问题。根据《生成式人工智能服务管理暂行办法》(2023年)第7条的规定,生成式人工智能服务提供者依法开展预训练、优化训练等训练数据处理活动时,不得侵害他人依法享有的知识产权。新一代人工智能的技术核心是以“数据训练算法”为特征的机器学习,数据的好坏直接关系人工智能的好坏,相比其他数据,作品数据是典型的高质量数据资源,具有无与伦比的算法训练价值。[1] 因此,在机器学习过程中,在预训练(包括预训练素材输入)等数据输入阶段必然会利用已有的作品资源,并已引发著作权争议。2023年12月,美国《纽约时报》提起诉讼,指控OpenAI的聊天机器人ChatGPT和微软的Copilot未经许可利用其内容开发AI产品,这些AI产品接受了数百万条《纽约时报》内容的训练,并利用这些材料为用户的提示生成答案。[2] 《纽约时报》的诉讼将机器学习的著作权争议,从理论探讨变成了现实问题。人工智能的高速发展已经导致权利人与使用人的地位受到前所未有的颠覆,AIGC正日益严重威胁到以人类作者为代表的著作权人的利益。在生成式AI面前,著作权人无法洞察和控制人工智能对其作品的利用,也难以取得报酬,利益的天平被瞬间打破。有鉴于此,从长远和整体的利益视角出发,本文将尝试提出引入作品补偿金制度,来重构各方的利益格局,并提供持续的制度激励。
2.1? 作品素材的巨量使用导致权利许可机制失灵
2.2? 单个作品的微量使用导致侵权判定机制失灵
2.3? 作品资源的隐蔽使用导致侵权举证机制失灵
2.4 AI内容的海量输出导致创作激励机制失灵
基于生成式人工智能的飞速发展,在机器学习预训练等场景中的作品利用如何重新平衡著作权人与AI开发者以及后续运营商、使用人的利益,学界提出诸多理论学说或观点,以提供解决方案。有的依据临时复制、机器无须许可、合理使用、公有领域等理论主张机器学习不构成侵权,以促进人工智能产业的发展,但对著作权人的专有权置若罔闻。有的主张机器学习中的作品复制等行为落入著作权的专有权控制,理应支付报酬,进而提出集体管理说、法定许可说等解决方案。世界知识产权组织(WIPO)2024年3月发布的《生成式AI知识产权导航》也表达了谨慎的倾向,为避免争议应获得第三方受版权保护内容的授权,再进行训练人工智能。[5] 但这种严苛的专有权保护模式将会限制人工智能的发展。本文折乎其中,提出将著作权补偿金制度作为一种可选的方案运用于AIGC时代,以解决机器学习预训练等环节的侵权争议。
3.1? 补偿金制度的制度回溯:利益平衡的机制设计
3.2?基于机器学习的补偿金制度:利益补偿的理论逻辑
4.1?回避侵权判断难题
4.2? 省略许可谈判程序
4.3?解决使用费分配难题
4.4?避免使用费堆叠问题
4.5?不影响专有权独立行使
传统上,补偿金制度的产生以无法对私人复制进行控制为前提,随着数字版权管理技术措施的发展,私人复制在网络环境下已经可以得到相当地控制,但生成式AI、大语言模型的发展,让机器学习这样的“商业复制”也变得无法控制,发源于扭转私人复制利益失衡的补偿金制度在数字版权管理时代看似式微,又在人工智能时代可以迎接新的使命。补偿金制度作为利益再平衡机制,在我国著作权法上尚属立法空白,在人工智能已经崛起的时代,我国应当引入补偿金制度并将其本土化。
5.1?厘清支付补偿金的义务主体
5.2?明确补偿金的法定征收主体
5.3? 采取比例费率的征收标准
5.4?确立面向公共利益的使用机制
对于机器学习中的作品利用,一种观点是通过主张系临时复制或合理使用,或者基于公有领域等考虑而直接将其认定为不侵权;另一种观点则是将其纳入著作权专有权的控制范围,并以此为基础提出授权使用、集体管理、法定许可等解决方案。一些掌握优质训练素材的厂商会通过技术措施等手段阻止对其内容的过度访问或索取, AI开发者或运营商必须取得使用授权才能获取进行数据训练。对处于公开状态、权利人众多且分散的作品素材,考虑到存在素材输入的“复制” 争议,出于谨慎,为积极消除这些素材的来源风险,集体管理组织的集中授权虽然是一个选项,但受制于代表权利人的有限性,往往无法满足全部训练素材的授权要求,因而修法将机器学习的作品利用纳入法定许可是相对较佳的制度选择。不过,法定许可模式需要建立在被利用作品及其权利人可识别、可追溯的基础上,其制度运行成本也相对较高。
作为解决机器学习中作品利用合法性问题的可选方案,著作权补偿金制度是基于人类作者整体利益的保护,相对于侧重个体利益保护的授权使用、集体管理、法定许可等模式具有补充性,甚至可以考虑在授权使用、法定许可等专有权控制模式之外,仍能有限度地并行征收补偿金 “税”,且该制度本身可以立法纳入强制性集体管理框架之中。同时,无论机器学习的作品利用是否认定侵权,补偿金制度都具有兼容性,它与临时复制、合理使用等不侵权主张并不冲突,即使机器学习的作品利用不受专有权控制,为了扭转失衡的各方利益,也可以考虑向特定主体征收补偿金。总之,可以探索在不同情形下采用合理使用、集体管理、法定许可以及补偿金制度等多种解决方案,为机器学习中作品利用的合法性提供制度支持,并让各方利益保持恰当的平衡。
参 考 文 献
(上滑查看)
[1] 李安.?机器学习的著作权规则:历史启示与当代方案[J].?环球法律评论,2023(6):97.
[2] 纽约时报起诉要求销毁ChatGPT,赔偿数十亿美元(起诉状全文)[EB/OL].(2024-01-04)[2024-05-05].?
https://mp.weixin.qq.com/s/Vir_jOJcW947-7hZSUlAFg.
[3] 袁真富.?用户创造内容(UGC)的著作权合理使用问题研究[J].?科技与出版,2020(10):9.
[4] 刘银良.?论人工智能作品的著作权法地位[J].?政治与法律,2020(3):3.
[5] 林华.?人工智能立法与合规中的版权挑战[EB/OL].(2024-04-16)[2024-05-05].?
https://www.163.com/dy/article/IVSNOUCI0556781P.html?spss=dy_author.
[6] 张今.?数字环境下的版权补偿金制度[J].?政法论坛,2010(1):80-87.
[7] 彭桂兵,冒乙静.?补偿金制度:探讨互联网时代调整私人复制行为的利益再平衡机制[J].?媒体融合新观察,2020(6):50.
[8] ANDRE?F?C,JOHN?D,FIONA?R.?Canada's?private?copying?levy-does?it?comply?with?Canada's?international?treaty?obligation?[J].Intellectual?Property,2006 (20):111-134.
[9] Alliance?of?artists?and?recording?companies,"AARC?Summary"[EB/OL].(2024-05-16--20)[2024-05-20].?
http://www.aarcroyalties.net/forms/AARC?Summery.pdf.
[10] 徐龙.?机器学习的著作权困境及制度方案[J].?东南学术,2022(2):239.
[11] MARTIN?S.Generative?AI?and?author?remuneration?[J].?2023(54):1535-1560.
[12] 刘友华,魏远山.?机器学习的著作权侵权问题及其解决[J].?华东政法大学学报,2019(2):68-79.
[13]? 庄善洁.?权利弱化与利益分享:重构信息网络传播权与图书馆信息共享利益平衡新理论[J].?图书与情报,2008(5):76-78.
[14] 陶鑫良.?网上作品传播的“法定许可”适用探讨[J].?知识产权,2000(4):11-15.
[15] 高阳,胡丹阳.?机器学习对著作权合理使用制度的挑战与应对[J].?电子知识产权,2020(10):15.
[16]? 曹世华.?论数字时代的版权补偿金制度及其导入[J].?法律科学(西北政法学院学报),2006(6):147.
[17]? 张平.?生成式人工智能数据训练知识产权合法性问题探讨[EB/OL].(2023-08-31)[2024-05-05].?
https:// mp.weixin.qq.com/s/8N4-ojQvfmRnhP_HfMinVQ.
[18] 李青文.?论数字环境下我国著作权补偿金制度之构建[J].?编辑之友,2017(11):81.
[19] ERIC?D.?Copyright,compensation,and?commons?in?the?music?AI?industry[J].?Creative?Industries?Journal, 2021(2):202.
袁真富??夏子轩
上海大学法学院知识产权学院