Github Copilot 是否违反 GPL 协议?

2021-07-07 15:52:21 +08:00
 stimw

看见公众号推送的,想了想觉得挺有意思:

在 GitHub Copilot 直接复制快速平方根倒数算法这个过程中有个矛盾点,即这段代码是遵循 GNU GPL 2.0 协议进行开源的,而 GitHub Copilot 却要在未来扩展为付费服务提供。

在此基础上,就产生了一个巨大争议:这个现象表示 GitHub Copilot 在训练过程中必定使用过 GPL 协议下的代码,那么机器学习系统产生的作品,甚至机器学习系统本身,都算是 GPL 协议中规定的衍生作品吗?

  • 如果答案是“否”,那是不是说明开发者可以利用 GitHub Copilot 来“清除”代码的 GPL 协议,从此再也无需遵循该协议?

  • 如果答案是“是”,那么不仅 GitHub Copilot 应该免费开源,整个 GitHub 都要成为一个开源项目:据 GitHub 博客中“在 GitHub Copilot 的早期开发过程中,作为内部试用的一部分,近 300 名员工在日常工作中使用了它”的说法,这些员工很有可能已经将 GitHub Copilot 生成的代码整合到 GitHub 的方方面面,那么 GitHub 就也应该是个开源项目。

5092 次点击
所在节点    GitHub Copilot
24 条回复
baobao1270
2021-07-08 13:02:46 +08:00
我们平时写代码,也经常复制黏贴其他地方的代码。
如果我们只是复制黏贴了一小段,比如一个函数或者几行算法,那么我们要把这个代码的 License 包含在项目里吗?
这个问题的答案同样也适用于 Copilot 。

如果哪天 GitHub 的 License 加一个“在 GitHub 上上传代码意味着在许可证之外授权 GitHub 使用代码”的条款,那么对开源界有什么影响呢?
no1xsyzy
2021-07-08 13:25:57 +08:00
所以说 Copilot 只会自取灭亡。
你写起来快了,Review 成本成倍提升。
就好像说 Perl……
宁可花一年去琢磨基础结构,划分抽象,也不要这样飞速写完花十年去查验。

@baobao1270 有时这「几行算法」如果是专利的一部分,会强制你遵守 License 以获得正确的专利授权,否则涉嫌专利侵权。

@Vancion 但实际上现在发现实际比例可能高不少。
akira
2021-07-08 23:29:36 +08:00
@no1xsyzy 人类追求的是如何 努力提高生产工具的效率 ,其他的任何行为,在这个大势面前终将消逝
a132811
2022-02-15 09:27:11 +08:00
@no1xsyzy 我觉得 Copilot 应该不会自取灭亡,即使灭亡了,也还会有新的更智能的工具出来,有可能会更好的解决版权问题。

关于 Review 成本:Copilot 是否明显增加 bug 产生的风险,可能影响没有想像的那么大。我更相信大部分人写的代码、复制来自 stackoverflow 的代码片段、迭代修改的代码,都是 bug 四溢的。。我个人更头疼一个项目引入大量的开源库、闭源库出现的未知 bug 、feature 支持(无论是自己还是等官方,一般都要较长的时间)

关于版权:我想起谷歌抄的那几行 API 代码,最终被判合理引用。如果参数命名相似就算抄袭,写代码就是一件充满风险的东西——如果过去看过一些开源代码,后来脑子想起来可以这么实现,不知道算侵权不? Copilot 做的就是类似的事情。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/788108

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX