学术讲座—DeepSeek蒸馏的著作权法问题研究
发布者: 科研处 更新日期: 2025-05-27 访问次数: 10
讲座题目DeepSeek蒸馏的著作权法问题研究
主办单位法学院·知识产权学院
联合主办单位
讲座人林秀芹讲座人
职称
正高主持人梁开斌
讲座类型社会科学讲座对象全校师生时间2025-05-28 15:30
地点小会议室




牛津大学法学硕士,厦门大学法学博士,剑桥大学Jesus学院、伦敦大学亚非学院访问学者,德国马克斯·普朗克竞争与创新研究所访问教授, 英国玛丽女王大学客座教授。入选“全国知识产权领军人才”“百千万知识产权人才工程”百名高层次人才、“全国知识产权系统人才工作先进个人”。现任厦门大学知识产权研究院院长、教授、博士生导师,厦门大学法学院教授,厦门大学“一带一路”研究院教授委员会成员,国家知识产权培训(福建)基地执行主任,国家知识产权战略实施(厦门大学)研究基地主任,数字福建大数据基础技术厦门研究院大数据法律保护与技术伦理研究中心主任。兼任全国知识产权专业学位研究生教育指导委员会委员,中国法学会知识产权法学研究会副会长,中国法学会经济法学研究会常务理事,福建省版权协会首届理事,厦门市法学会知识产权法学研究会名誉会长,厦门市知识产权协会副会长,厦门联合信实律师事务所律师,福建品同律师事务所高级顾问,厦门仲裁委员会仲裁员 。
讲座
主要内容
讲座内容: DeepSeek训练提效的原因主要包括:低精度计算、小参数量和高质量数据等。据DeepSeek-V3的技术文档,该模型使用数据蒸馏技术(Distillation)生成的高质量数据提升了训练效率。数据蒸馏指的是通过一系列算法和策略,将原始的、复杂的数据进行去噪、降维、提炼等操作,从而得到更为精炼、有用的数据。 蒸馏在什么情况下可能被视为“偷窃”。这涉及到法律和技术两个层面。技术上,知识蒸馏并不会直接复制教师模型的参数或训练数据,而是通过模仿教师模型的输出来训练学生模型。因此,从技术角度看,学生模型并不包含教师模型的原始数据,但可能捕捉到教师模型的一些行为模式。 DeepSeek蒸馏是否会引发著作权问题?如果教师模型本身是受版权保护的,那么未经授权使用其输出来训练学生模型是否构成侵权,目前法律界还在讨论中。例如,美国版权局认为,通过机器学习生成的内容可能不受版权保护,但如果训练数据包含受版权保护的材料,使用这些数据可能引发法律问题。 讲座拟从《中华人民共和国著作权法》进行分析,探讨DeepSeek蒸馏引发的著作权法问题。