用 python 写的一个关于知乎的项目,可以获取知乎上的各种内容,也方便备份答案

2014-12-16 12:37:14 +08:00
 egrcc
不到1000行,可以方便获取知乎上问题,答案,用户,收藏夹信息,并可以将答案导出为 txt 或 markdown 文件。详情请见github地址: https://github.com/egrcc/zhihu-python
代码可能写得不是很好,欢迎大家提出各种改进意见,帮助完善该项目。
之后我还想添加话题,知乎专栏,以及热门信息的内容。
5523 次点击
所在节点    分享创造
13 条回复
sakurae
2014-12-16 13:04:59 +08:00
厉害哦
egrcc
2014-12-16 13:14:47 +08:00
@sakurae 哈哈,谢谢夸奖,自学编程还不到一年,这算是我写的最大的项目了。请多多指教
neargle
2014-12-16 13:21:11 +08:00
自学编程不到一年TWT会用Git和Github,会写Python...
我还是不说自己是学计算机专业的了
invite
2014-12-16 13:23:50 +08:00
不错,提个小建议:根据URL自动判断是Question,还是User,还是Answer。
egrcc
2014-12-16 13:38:12 +08:00
@neargle 数学系也要用python搞科学计算,机器学习什么的,所以就学了python
egrcc
2014-12-16 13:52:30 +08:00
@invite 目前这个项目只是相当于提供了一个接口,Question,User等都是需要用户自行创建,作为抓取的入口,自行编写程序完成整个抓取过程。如果创建User传入的却是question的url,程序会报错。而项目内部自然会根据url创建相应的类。
sakurae
2014-12-16 14:28:22 +08:00
@egrcc 我才要让您多多指教呢呵呵
oloopy
2014-12-16 14:45:23 +08:00
非常棒!
liuhang
2014-12-16 15:01:47 +08:00
好棒!赞一个
egrcc
2014-12-16 23:29:18 +08:00
@oloopy 谢谢支持
egrcc
2014-12-16 23:29:39 +08:00
@liuhang 谢谢支持
net200
2014-12-17 16:32:08 +08:00
@egrcc 原来是数学系的大神 给您跪了
egrcc
2014-12-17 19:49:54 +08:00
@net200 在数学系已成渣

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/154300

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX