我做了一个自动搬运B站视频到 youtube 的 bot,结果被谷歌封了

2019-01-13 13:08:41 +08:00
 zhangolve

真实经历,写了篇博客总结下。

一个 YouTube 视频搬运工的教训

节选:

说一下,我搬运视频的代码思路。这种做法,毕竟是侵权的。

首先,通过 node 爬虫,模拟浏览器的访问,获取到B站某个 up 主的所有视频,接下来通过 node 的 child_process 来执行 you-get 的命令行命令,使得这个 up 主的视频能够批量地被下载下来。当然,我并不想竭泽而渔,也觉得老视频没有多少意义,所以每个 up 主,我最多只爬去最新的 100 个视频。

接下来,我会将视频通过 YouTube 接口的方式,批量地上传到指定的频道上面去。

后来,随着我的开发,细节也越来越完善。

支持持续订阅某个 up 主,思路也无非是隔一段时间,爬去最近这段时间内他的上传的视频。

支持将同一个 up 主的视频放到同一个播放列表里,之所以这样做,一则是因为视频更方便管理和浏览。二则是害怕某天突然被告知,我偷了他的视频,这样删除的时候,也只需要找这个播放列表里的视频删除可以了。

原有的视频下载和上传的脚本是隔离的,导致做不到自动化。后来,这个工作实现了自动化。只需要在一开始将某个 up 主进行订阅,之后,下载,上传,长期订阅和上传这个 up 主的视频都能够自动完成。

坦白讲,写这个代码写得还挺开心,很大一部分因为是以前很少用到 js 里异步控制的 async await,但是这次代码写起来,用了很多,也用得很爽吧。另外以前也很少写 node 的后台服务,最多也就是写两个爬虫,这次却借助这个想法,顺便学了一波 node 服务的部署和运维(为了做这件事情,也为了科学上网,我当时还买了一台阿里云 vps,后来因为科学上网,服务挂了。我又换到了搬瓦工,这才一切稳定)。当然,有人可能会觉得我这种行为侵权,这个话题,我一会儿再聊。

6551 次点击
所在节点    奇思妙想
65 条回复
AfChu
2019-01-13 17:55:11 +08:00
楼主你这是“作恶”,我之前做了一个混剪视频,差不多用了大半年时间完成的(利用周末和下班休息时间)我深知原创创作者的辛苦,在 B 站上看到被人上传了,看到的时候我是非常不爽。然后找了一些证据投诉 B 站,没想到平台也不作为,还让我提供很多资料来证明如何如何,我对这个平台也是无语了。幸好没有把视频放到 B 站上分享。
FindHao
2019-01-13 17:59:13 +08:00
adsense 里做 youtube 视频的非常多,比网页广告赚钱容易,当然要对版权严格。
wqyyy
2019-01-13 17:59:30 +08:00
“关于盗版这件事情,我自己的态度一直模凌两可。我不认为这件事完全没有正面价值,不然,我也不会去做这样的事情。在写此文的时候,我甚至会想到 13 年去世的亚伦·斯沃茨 ,他是个反对禁止网络盗版法案的运动的人,很大程度上,我是欣赏这种黑客精神的。所以,我对版权上的问题,其实是没有多少反思的。因为如果真要较真的话,我搬运的那些B站视频 up 主们也毫无例外都有问题。

作者:继续海阔天空
链接: https://www.jianshu.com/p/c094164d3daf
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。”
(模凌两可->模棱两可)

不要侮辱 Aaron Swartz,人家当初反对 SOPA 不是为了鼓励你这样的侵权者,而是为了阻止某些审查权力的扩大(“ but was criticized on the basis that it would have made it easier for the U.S. government to shut down web sites accused of violating copyright and would have placed intolerable burdens on Internet providers ”)。

再来看你写的,“我觉得这是个不错的点子,后来又经过研究,得知 YouTube 上的视频,大概每千次观看量,视频的所有者可以得到大概 5 元人民币的收益(已经过换算)。而内容的影响力又是绵延不绝的,只要是好的内容,接下来就是躺着挣钱了。我当然是看好 YouTube 和他的收益情况的,毕竟我要做的,也不是自己制作视频,而是靠搬运。但紧接着,我又发现,谷歌对于 YouTube 频道的收益有一个门槛,只有达到了在过去的一年里,有 1000 个订阅者,4000 个小时的累计播放量,才能够申请通过广告分成的方式获取收益。经过简单的计算,我发现,实际上,只需要每天 10 个小时的播放量,就可以达到 4000 小时累计播放量这个门槛,而只要有几个爆款视频,订阅者也会越来越多,这个门槛并没有多难以跨过。”
可以看出你的动机是为了窃取别人的(反正不是你的)劳动成果获利,而 Aaron Swartz 下载 JSTOR 上的论文是为了开放获取,为了反对论文出版商对于论文获利的不正当占有而没有出于自己经济利益的考虑(对于 PACER 也是一样)。把你的行为跟 Swartz 类比、跟“黑客精神”类比,真是让人感到羞耻。
FindHao
2019-01-13 17:59:51 +08:00
封你很正常。
wqyyy
2019-01-13 18:02:01 +08:00
借用 Notch 的话:“如果你玩的是盗版也没关系,毕竟盗版是最好的宣传,但玩的时候请别忘记带着羞耻心。"
hanqian
2019-01-13 18:03:18 +08:00
我给楼主一个建议,其实你没必要完整描述整个事情。技术归技术,别的没必要提。
westoy
2019-01-13 18:04:59 +08:00
@zhangolve

这阶段不光审查新视频, 老的也在审查, 不仅是大片带版权物被查, 还经常有一大段视频里引入几秒背景画面或者背景乐是版权物的(比如电视画面), 就把版权和分成划给这段版权所有方的案例, 而且经常有乌龙。。。。

搬运就别再考虑了, 以前搞搬运也是填充内容引流,google 睁一只眼闭一只眼, 不举不究, 反正平台方可以甩锅, 现在是"刁民, 想害朕"
AfChu
2019-01-13 18:08:19 +08:00
另外再说下,v 站里有很多程序员跟你用的是一样的思路,YouTube 粉丝已经达到好几千甚至上万的都有,但是他们犯了一个很低级的错误就是以为搬运能通过 YouTube 合作伙伴计划,但是目前来看,目前还没发现通过搬运的能开通获利功能,如果有,请留言分享一下你的经验。我自己的频道是 11 月 30 号申请获利功能,并与 12 月 24 日通过了获利,当然我也是为了测试这个流程分享一下而已。
oddisland
2019-01-13 19:11:42 +08:00
就是想用别人的劳动成果换取自己的利益
说的有多高尚一样
脸皮也是够厚的
yeshang
2019-01-13 19:12:32 +08:00
代码分享不?
ilgharkus
2019-01-13 20:57:28 +08:00
@zhangolve #8 所以呢?想表达什么? Bilibili 是收录在 Google 里的,Youtube 有版权检测系统,如果检测到侵权肯定是会管的,你说侵权这个问题一会再说,那么还有什么可以说的?谷歌封你不对?
ilgharkus
2019-01-13 21:03:58 +08:00
看完博文简直是脑回路清奇。
“想到既然别人可以,我为什么不可以呢?”这种恶臭言论也真能说的出来。
“我发了两封邮件过去,想要解释我的动机。我解释了我是个程序员,只是为了学习知识。”既然是为了学习知识,那为什么要爬别人的视频再发到油管? B 站的审核现在已经很弱了,看看那些营销号视频就知道,为什么不自己上传视频再搬运到油管?本来的动机就包含侵权,现在又来装无辜?
zingl
2019-01-13 22:42:15 +08:00
>有人可能会觉得我这种行为侵权

除了 LZ 还有人觉得不侵权的?
RqPS6rhmP3Nyn3Tm
2019-01-14 07:49:08 +08:00
b 站有 API,不过都得靠自己扒
zhangolve
2019-01-14 09:07:25 +08:00
@wqyyy 你说的有道理,惭愧,惭愧。
zhangolve
2019-01-14 09:07:55 +08:00
@wqyyy 是,我知道羞耻。
zhangolve
2019-01-14 09:09:17 +08:00
@hanqian 我也是在反思吧。
我既然反思,就要把整个过程包括当时的所思所想写出来。
zhangolve
2019-01-14 09:11:55 +08:00
@oddisland 看我原文,我知道自己是侵权的。我也知道我搬运的视频 up 主本身也侵权。
zhangolve
2019-01-14 09:13:35 +08:00
@ilgharkus 你说的对,我的确是侵权的,当时发邮件过去,那个理由,更多的是借口而已,说学习只是一方面。更多的还是觉得有利可图,这个我不反对。
zhangolve
2019-01-14 09:14:30 +08:00
@oddisland 我没有说我高尚,我原文就说了,我是知道自己侵权的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526553

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX