AIGC平台侵权被判！企业不必过度惊慌——“全球首例生成式AI”判决解读

标题摘要内容

当前的位置：

首页 >> AIGC平台侵权被判！企业不必过度惊慌——“全球首例生成式AI”判决解读

详情

来源: | 作者:程念、谢已晴 | 发布时间: 2024-02-28 | 5216 次浏览 | 分享到:

部门介绍：垦丁律师事务所人工智能法律研究是专注于人工智能法律研究、法律问题对外联动以及各类活动组织与承办的部门，以期在这一领域深耕与挖掘，为整个市场的发展贡献力量。

2024年2月8日，广州互联网法院依法对全球AIGC平台侵权第一案作出判决（2024粤0192民初113号），要求被告平台立即采取相应技术措施防止生成侵权图片，并赔偿原告经济损失及合理开支10000元。本案中，被告作为AIGC平台，其旗下AI绘画功能被证实能多次训练并生成相应侵权图片，法院认定其担责的主要原因在于：投诉举报机制欠缺、潜在风险提示欠缺、显著标识欠缺。

本案是我国首个对AI大模型生成侵权数据的案件审判，该案例无疑给了有类似情况的AIGC平台运营者一个警醒，也给市场的有序发展带来积极地推动作用。从该案例出发，一般侵权责任的构成要件有侵权行为、过错、损害结果、侵权行为与损害结果的因果关系，因此AIGC平台运营者合法合规经营需要注意避免潜在的侵权风险：

1.采取措施避免侵权行为

2.采取措施表明没有侵权的主观恶意

3.发生纠纷后，及时采取措施处理已经投入训练的侵权数据

一、侵权数据的删除

在上述第一案中，法官已经详细说明了被告平台没有尽到合理的注意义务（投诉举报机制欠缺、潜在风险提示欠缺、显著标识欠缺）而具备主观过错，因此AIGC企业需要配套完备的知识产权保护机制，包括知识产权保护条款、侵权提示、主动审核的保护措施、投诉举报渠道等。除此之外，就侵权结果，企业还需要有效的技术手段予以干预。

一方面，如果AIGC大模型产品的训练数据中包含可能侵权的数据，那么在后续出现纠纷后，企业应该采取有效措施来消除侵权数据带来的影响；另一方面，如果AIGC大模型删除自身侵权数据，那么它在训练过程中所积累的知识和表现将会受到影响。为了确保合规性和尊重知识产权，保护权利人的合法权益，删除侵权数据仍是必要的。在此过程中，AI大模型需要不断优化和调整，以适应新的数据集，提高合规性。

同时，为了减少侵权风险，AIGC大模型开发者可以采取以下措施：

1.数据审查：首先，企业需要对训练数据进行全面审查，确保数据来源合法，避免使用涉及侵权的数据。有条件的可以与版权持有者或相关法律专家的合作，以确定哪些数据可能构成侵权。

2.数据删除：一旦确认了侵权数据，企业应该立即从训练数据集中删除这些数据。这可能需要重新训练模型，以确保新模型不再受到这些侵权数据的影响。

3.用户协议更新：企业应该更新用户协议，明确指出用户在使用AIGC产品时不能上传或使用侵权内容。同时，企业还应该在用户协议中声明自己已经采取措施来删除可能存在的侵权数据。

4.内部政策调整：企业应该制定内部政策，确保所有员工都了解并遵守相关的版权法规。这包括对员工进行版权法培训，以及建立一个报告和处理潜在侵权问题的流程。

5.技术改进：企业应该投资于技术改进，例如开发更有效的数据筛选工具，以自动检测和移除可能的侵权内容。此外，企业还可以考虑使用数据水印、数据溯源等技术来追踪和记录数据来源，以便在必要时证明自己已经采取了合理的措施来防止侵权。

6.合作与沟通：企业应该积极与版权持有者和其他利益相关方进行沟通，寻求合作机会。这可能包括购买版权许可，或者与版权持有者签订合作协议，以确保自己的产品不会侵犯他人的权益。

7.风险管理：企业应该建立一套全面的风险管理系统，包括定期评估版权风险，制定应对策略，以及监控和报告侵权事件。

总之，删除侵权数据是AIGC大模型进一步发展的必要举措，企业及开发者需要关注数据合规性，不断创新和优化技术，为用户提供更安全、合规的AI服务。

如果一个大模型已经接受了侵权数据，重新训练它以“忘记”这部分侵权数据的过程通常被称为“遗忘”或“删除”。这是一个复杂的问题，因为大模型通常会将训练数据中的模式内化为其参数中，使得删除特定数据点变得困难。目前，有一些技术方法可以帮助解决该类问题：

1.重新训练：最直接的方法是重新训练模型，但不使用侵权数据。这需要收集新的训练数据集，其中不包含侵权数据。然后，使用这个新数据集重新训练模型。这种方法可能会导致模型性能下降，因为它失去了部分训练数据。

2.干扰学习：另一种方法是干扰学习，也称为对抗性训练。这种方法涉及向模型添加一些噪声或干扰，使其“忘记”之前学习的某些模式。这可以通过在训练过程中引入对抗性样本来实现，这些样本旨在误导模型并使其忽略特定的模式。

3.反向传播删除：这是一种基于梯度下降的技术，用于删除特定数据点的影响。基本思想是通过反向传播算法计算出删除特定数据点所需的参数更新量。然后，应用这些更新来改变模型参数，从而减少对这些数据点的依赖。

4.知识蒸馏：知识蒸馏是一种迁移学习技术，其中原始模型的知识被转移到一个新的较小模型中。在这个过程中，可以丢弃原始模型，只保留新模型，从而有效地删除了原始模型中的侵权数据。

5.隐私保护技术：一些隐私保护技术，如差分隐私，可以用来限制模型对特定数据点的依赖。这些技术通过在训练过程中引入随机性来保护数据的隐私，从而使得模型无法准确地记住特定的数据点。

需要注意的是，这些方法并不能完全保证删除侵权数据的效果，因为大模型的复杂性和非线性特性使得它们很难精确地“忘记”某些数据。此外，这些方法可能会导致模型性能下降，因为它们改变了模型的参数。

二、第三方数据接口

如果大模型企业的产品是通过接入第三方提供的接口实现的，那么企业仍然可以采取一些技术措施来防范潜在的版权侵权问题。以下是一些建议：

1.尽职调查：在选择第三方接口提供商时，企业应该进行充分的尽职调查，确保这些提供商具有合法的版权许可或授权，以避免使用可能侵权的内容。

2.合同条款：企业应该在与第三方接口提供商的合同中应明确双方的权利义务，合同内容应明确加入数据合规、知识产权、保密、责任分配等相应条款，要求对方保证提供的内容不侵犯任何第三方的合法权益，并承担相应的法律责任。

3.内容过滤：企业可以使用内容过滤技术来检测和阻止可能侵权的内容。这可以通过使用人工智能技术，如图像识别和文本分析，来自动检测和移除可能侵权的内容。

4.用户举报系统：企业应该建立一个用户举报系统，允许用户报告他们认为可能侵权的内容。企业应该认真对待这些举报，并迅速采取行动来调查和处理这些内容。

5.版权教育：企业应该对员工进行版权教育，让他们了解版权法规和企业政策，以确保他们在使用第三方接口时能够遵守版权规定。

6.风险评估：企业应该定期进行版权风险评估，以识别潜在的版权问题，并采取适当的预防措施来降低风险。

7.法律咨询：企业应该寻求专业的法律咨询，以了解版权法规的最新变化，并确保自己的产品和服务符合这些法规。

8.技术更新：企业应该不断更新自己的技术，以适应版权法规的变化和技术的发展。这可能包括改进内容过滤技术，以及开发新的版权保护工具和策略。

尽管这些措施不能完全消除版权侵权的风险，但它们可以帮助企业降低风险，并在发生侵权事件时更好地保护自己。企业可以根据实际需求和场景选择合适的过滤方式，对第三方接口提供的数据进行内容过滤，在实际操作过程中，还需要关注数据安全和合规性，确保过滤结果符合相关法律、法规。在接入第三方接口的情况下，内容过滤可以通过以下步骤实现：

1.接口数据获取：首先，企业需要从第三方接口获取数据。这通常涉及调用API（应用程序编程接口），并接收来自接口的数据流。这些数据可能包括文本、图像、视频等多种类型。

2.内容分类：接下来，企业需要对获取的数据进行分类，以便于后续的过滤操作。这可能涉及使用自然语言处理技术来分析文本内容，或者使用计算机视觉技术来识别图像和视频中的物体和场景。

3.版权关键词库：企业需要建立一个版权关键词库，其中包含可能涉及版权侵权的关键词和短语。这个关键词库可以由企业自己创建，也可以从公开的版权数据库中获取。

4.内容匹配：企业需要将接收到的数据与版权关键词库进行匹配，以确定是否存在可能的侵权内容。这可能涉及使用文本匹配算法，如余弦相似度或Jaccard相似度，来比较数据和关键词库之间的相似性。

5.关键词过滤：根据设定的版权关键词库，对第三方数据进行筛选。如果发现存在可能的侵权内容，企业需要采取措施来删除或替换相关内容，或者限制用户访问这些内容的能力。

6.内容标记：企业还需要对可能的侵权内容进行标记，以便于后续的跟踪和处理。这可能涉及在数据中添加元数据，如版权信息或过滤状态，以便于后续的分析和决策。

7.反馈和优化：企业还需要对接口提供的数据进行测试和验证，并收集和分析过滤结果的反馈，以不断优化过滤算法和关键词库。这可能涉及使用机器学习技术，如监督学习或强化学习，来自动调整过滤规则和策略。

需要注意的是，内容过滤技术并不能保证完全消除版权侵权的风险，因为它们只能检测到已知的侵权内容，而无法预测未知的侵权内容。此外，内容过滤技术也可能产生误报，即错误地将非侵权内容标记为侵权内容。因此，企业在实施内容过滤技术时，需要平衡版权保护和用户体验之间的关系，并采取适当的措施来减少误报率。

最后，关于使用第三方接口的企业的侵权行为。根据“AIGC平台侵权第一案”，《生成式人工智能服务管理暂行办法》第二十二条第二款规定，生成式人工智能服务提供者，是指利用生成式人工智能技术提供生成式人工智能服务(包括通过提供可编程接口等方式提供生成式人工智能服务)的组织、个人。同时，根据第十四条第一款规定，提供者发现违法内容的，应当及时采取停止生成、停止传输、消除等处置措施，采取模型优化训练等措施进行整改，并向有关主管部门报告。被告平台作为服务提供者，侵犯了原告所享有的著作权，应承担停止侵权，即停止生成的责任。法院认为关于被告主张AI绘画服务系由第三方服务商提供，其不承担责任的抗辩，不应予以采纳。

综上，使用第三方接口的企业不能以第三方提供服务为由消除侵权责任，但是可在承担侵权责任后依据与第三方服务商的协议等向第三方主张违约责任。AIGC企业在与第三方合作时除了做好尽调，也应当关注双方的合同协议，尤其是知识产权条款。接入第三方接口的仍然需要有自己的技术措施对内容进行把控，避免出现违法和侵权事宜。

作者

程念

垦丁律师事务所人工智能法律研究部负责人，中国政法大学法学硕士（网络法学专业），专注于数据合规、个人信息保护、直播短视频、人工智能及涉网诉讼、元宇宙与NFT合规等互联网法律实务工作，为多家知名网络公司提供常年法律顾问服务等，参与首例5G云游戏侵权案、直播带货预期可得追回案等典型案件的办理，参与撰写《直播与短视频产业合规蓝皮书》《元宇宙与元规则——元宇宙产业及元规则体系建构蓝皮书》等报告。参与编写著作《<中华人民共和国数据安全法>理解与实施》。

谢已晴

垦丁律师事务所人工智能法律研究部成员，杭州亚运会选调律师，日本早稻田大学法学硕士。主要执业领域为数据与个人信息合规、数据跨境、直播与电商合规等。目前为垦丁所【隐士·APP个人信息及隐私政策检测】产品负责人，某大型车企电子商务业务法律顾问，曾参与多起数据隐私及电商直播平台合规服务，包括某大型直播平台直播带货合规方案、某互联网企业上市前数据合规项目、多款APP个人信息收集使用与隐私政策合规方案、绿色直播间合规评审活动等。

上一篇：【产业要闻】OpenAI 的 Sora 技术报......

下一篇：李强：中国为全球人工智能治理提供建设性方案——《......

标准信息