固法评论
2025年年初,生成式人工智能大模型Deepseek横空出世,其不仅实现了高性能、低成本的技术突破,而且采取免费开放模型权限的开源模式,瞬间引发了各领域“Deepseek+”的应用热潮。然而,Deepseek的崛起也引发了围绕知识产权、数据保护、公平竞争以及科技伦理等方面的争议。本文立足于人工智能开源模式的法治保障,从版权法(非合同、竞争法等)视角探讨Deepseek应用过程中新出现的知识蒸馏行为的合法性。
使用知识蒸馏技术从其他大模型中提炼知识并应用于自身模型研发是OpenAI对Deepseek的主要指控之一。从技术角度言,“知识蒸馏的核心原理是通过让一个规模较大的‘教师模型’训练一个规模较小的‘学生模型’,使学生模型能够在计算资源受限的环境中最大化接近教师模型的性能。”在这一过程中,如果采集、存储和处理的海量数据具有可版权性(另一重要的争议问题),那么可能产生侵权风险。
鉴于知识蒸馏行为尚未落入我国法下的合理使用和法定许可的辐射范围,笔者建议可适用默示许可制度。版权默示许可是指“在特定情形下,版权人虽然未明示许可某人使用其作品,但是从版权人的行为或者其他原因可以推定其对该使用作品的行为不表示反对的一种许可形态”。在传统“选择-进入”默示许可之外,有学者主张默示许可“选择-退出”机制具有解决数据海量授权的重要制度价值,因而呼吁扩大其适用范围以解决数字网络环境中作品授权与使用、传播的矛盾。
默示许可之选择-退出机制能更好的调整特定产业发展与版权人专有权利之间的紧张关系,传统的搜索引擎正是得益于这一考量。在选择-退出默示许可机制下,如果版权人未能通过技术手段阻止其作品被他人以特定方式使用,那么视为许可使用。作者认为在生成式人工智能成为新质生产力的今天,以版权默示许可制度拓展人工智能行业的法律边界无疑是一个很好的选择。
注释:
①杨皓森,王雨乔,从OpenAI对DeepSeek的指控看“蒸馏”行为的合法性。
②郭威:《版权默示许可制度研究》,中国法制出版社 2014 年版,第 64 页。
作者:张红娇博士
广东固法律师事务所律师