[python3] B 站用户数据收集...(重发)

2019-07-15 09:23:09 +08:00
 cwjokaka

前天发了一次贴,秒沉。果然还是在大众摸鱼日发合适一点。

写了一个爬虫,用于收集 B 站用户数据,算是学 python 的实践项目吧^_^

3187 次点击
所在节点    程序员
19 条回复
locoz
2019-07-15 09:59:35 +08:00
太惨了,帮你捞一下
cwjokaka
2019-07-15 10:23:23 +08:00
@locoz 感谢,我也自顶一下
Deteriorator
2019-07-15 10:29:08 +08:00
帮你捞一下
xwcs
2019-07-15 11:00:25 +08:00
帮你捞一下
i0error
2019-07-15 11:12:25 +08:00
捞一下
i0error
2019-07-15 11:13:51 +08:00
去看了一下,很基础啊......建议有数据了分析一波再发。
cwjokaka
2019-07-15 11:17:35 +08:00
@i0error 是的,目前只是爬取阶段,而且相关数据内容有些少
hzwjz
2019-07-15 11:41:42 +08:00
按理说,不应该是在原帖的基础之上,想办法么?重复发帖了吧
cwjokaka
2019-07-15 12:18:10 +08:00
@hzwjz 是可以,但前天发的贴沉到海底,应该上不来了←_←
SpiderXiantang
2019-07-15 12:53:23 +08:00
用 dfs 爬取的吗
cwjokaka
2019-07-15 14:01:35 +08:00
@SpiderXiantang 没有.只简单调下接口而已
hjq98765
2019-07-15 14:40:10 +08:00
捞一下,学习学习
lzj307077687
2019-07-15 14:50:10 +08:00
刚开始学 py 学习下~
cwjokaka
2019-07-15 15:56:45 +08:00
cwjokaka
2019-07-15 17:16:52 +08:00
↑上去↑
cwjokaka
2019-07-15 18:05:45 +08:00
有哪里写的不足(bug)的地方可以说一说←_←(个人顶帖行为)
telnetning
2019-07-15 19:28:05 +08:00
楼主,是不是应该主动显示关闭下数据库连接
cwjokaka
2019-07-15 20:39:49 +08:00
@telnetning 是有这个问题,但我发现 worker 线程根本不用停下来。。。数据库连接也就不管了
cwjokaka
2019-07-16 08:26:24 +08:00
最后一顶

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/582981

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX