GitHub Copilot 被告了,喜提集体诉讼

2022-11-04 15:43:59 +08:00
 superrichman
https://news.ycombinator.com/item?id=33457063

https://githubcopilotlitigation.com/

大伙儿怎么看?
5719 次点击
所在节点    GitHub Copilot
25 条回复
mxT52CRuqR6o5
2022-11-04 15:45:07 +08:00
告赢了能给我退款吗
witcat
2022-11-04 15:45:20 +08:00
GJ
westoy
2022-11-04 15:46:35 +08:00
我现在已经沦落成它的注释生成器和人肉 tab 按键器

它要挂了我怎么办...........
ccyu220
2022-11-04 16:03:18 +08:00
赢还是输都得续费,已经离不开了。
AoEiuV020CN
2022-11-04 16:06:25 +08:00
先打个几年官司意思意思,
用户反响好的话总有办法应付,用户不买账就砍掉呗,
kop1989smurf
2022-11-04 16:10:22 +08:00
现阶段依赖机器学习的统计学 ai 就是有这个问题。
训练素材的提供者利益目前没有任何保证。
lambdaq
2022-11-04 16:10:31 +08:00
@mxT52CRuqR6o5 它起诉的目的不是钱,而是 copilot 利用了开源代码,但是没按照开源条款署名+继续开源。

其实开源软件是可以拿来打包售卖的。这一点和开源不冲突。
hahiru
2022-11-04 16:27:52 +08:00
快进到免费使用。
wolfie
2022-11-04 16:32:53 +08:00
@lambdaq
那应该开源 copilot 源码,还是训练后的数据。
kop1989smurf
2022-11-04 16:47:27 +08:00
@wolfie #9
@lambdaq #7

其实这个“遵从协议继续开源”,在机器学习领域也是伪命题。

1 、训练数据、代码、结果模型三者没有必然因果关系。
2 、模型内容不可查看。
3 、模型输出不可穷举。

核心矛盾就是训练数据、训练代码,训练模型结果、模型输出,这四者的关系在法律上,到底怎么分割,怎么定义。
ijrou
2022-11-04 17:18:13 +08:00
去看了下,100 美元一年,,确实挺贵的,要是开源免费用了,还会被告吗?
lambdaq
2022-11-04 17:57:23 +08:00
@wolfie
@kop1989smurf

这官司打的就这个问题。吃瓜即可。
www5070504
2022-11-04 18:01:00 +08:00
希望有后续 用开源数据做收费服务 感觉有被恶心到
hahastudio
2022-11-04 18:04:08 +08:00
之前还有人提到了在 Copilot 里发现了 copyright code
https://twitter.com/DocSparse/status/1581461734665367554
RiverMud
2022-11-04 18:17:49 +08:00
看到这个想起来 openwrt 的历史了,思科在诉讼压力下权衡利弊选择开源,然后有了 openwrt 等各种开源路由器系统。

不知道这次具体情况是什么样的,又会是个什么结果。
superrichman
2022-11-04 21:14:14 +08:00
@mxT52CRuqR6o5 去联系那个页面里的 legal team 邮箱说不定有用

@westoy 太可怕了,还好我没用过

@ccyu220 copilot 这么上头的吗?

@AoEiuV020CN 大公司就是这么任性

@lambdaq @hahastudio 喂给 copilot 的数据没有做限制就变成这样了

@wolfie 我觉得都要开源

@ijrou 之前没收费,虽然有人骂,但是没有真正出来告它。现在一收费,马上就开告 doge
ccyu220
2022-11-05 12:38:55 +08:00
@superrichman 对我来说上头,以前还买 webstorm ,现在 vscode + copilot 就差不过了。而且还能分析整个项目,很爽。
akaHenry
2022-11-07 05:14:34 +08:00
copilot 应该存在泄露 .env 这类文件的 私钥, 密码, token 等问题.

这些 .env 本地不提交的隐私文件, 只要被 编辑器打开, 必然被 copilot 扫描到.

小心你的私钥泄露.

如果是区块链钱包私钥和助记词, 小心钱没了.

都写过服务端程序, 都清楚各厂后台的 log 系统, 以及开发人员, 有多少人可以碰到一些敏感数据.

就怕有心人, 或者外部攻击者, 针对这些数据来攻击.

一旦被收集, 就存在泄露风险.
akaHenry
2022-11-07 05:18:49 +08:00
我使用 GitHub copilot, 已经成功帮我补全过别人泄露的第三方公共服务 API 的 (可用 token).

也就是说, 我白嫖了一些付费 API 的使用权限.

copilot 的数据泄露问题, 非常非常严重.

个人项目, 如果存在敏感数据, 即使是 .env 这种不提交 git 的. 也不建议使用 copilot.

文件只要被打开, 就被 copilot 扫描了. 说啥都没用的.

你说他不会上传?

笑话, 他不上传分析, 怎么知道你这个需不需要上传?

GG.
akaHenry
2022-11-07 05:25:32 +08:00
GitHub copilot 本质上和木马 /病毒没区别.

你如果授权他访问顶级目录权限, 原则上, 你等于允许他扫描你所有目录的文件内容.

你猜他扫描之后, 会不会上传云端分析?

使用 GitHub copilot, 是在付费买了一个木马, 让它盗取你的隐私数据.

更不要说, 它可以白嫖你的代码(成果).

你如果写的是算法类的, 策略类的模块. 断然不应该使用 GitHub copilot.

以后 Microsoft 可以偷程序员的成果. 这尊菩萨, 还是你主动请进来的.

是不是很滑稽.

好好想想这种 云端上传分析的功能, 是什么?

诸位在 Windows 上骂 360 软件, GitHub copilot 和它有区别吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/892682

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX