学 Python 不久,尝试写了个 instagram 爬虫,想问问大家的建议?

2019-06-08 18:11:26 +08:00
 waibunleung

学 python 不久,尝试参照别的库写了个 instagram 爬虫,想问问大家的建议?

link: https://github.com/luengwaiban/instagram-python-scraper

按照自己感觉写的,望各位 python 大虾能指点一下,教练,我想变强~

5100 次点击
所在节点    Python
38 条回复
waibunleung
2019-06-08 18:22:56 +08:00
little cute one waiting for you masters~
dt2vba
2019-06-08 19:40:32 +08:00
厉害,感觉方法的命名很不错,简洁、规范
vkhsyj
2019-06-08 20:12:04 +08:00
写的不错,代码规范也挺好的,说实话不像新手写的
Northxw
2019-06-08 20:55:30 +08:00
老油条~
waibunleung
2019-06-08 20:57:09 +08:00
@vkhsyj 之前有写过一下 php,不过也不是很厉害,算是有一点编程基础,谢谢您的肯定
waibunleung
2019-06-08 20:58:58 +08:00
还是恳请大家提出一些改进的建议,我现在心里没什么底的,因为我之前没接触过 python 开发,也不知道这样写是否是好的方式,请大家不要吝啬批评和建议呀~
waibunleung
2019-06-09 01:10:09 +08:00
up 一下期待更多大佬进来指点~
claysec
2019-06-09 12:38:28 +08:00
都能直接写包了😂😂😂
claysec
2019-06-09 12:41:05 +08:00
能拜师吗(滑稽)
waibunleung
2019-06-09 12:56:42 +08:00
@claysec 噗...别啊大哥,我认真的,我在各位大佬面前不敢抬头啊~
tikazyq
2019-06-09 15:11:39 +08:00
可以用爬虫平台 Crawlab 来管理你的爬虫,https://github.com/tikazyq/crawlab
waibunleung
2019-06-09 15:38:02 +08:00
@tikazyq ok,谢谢你的推荐。另外关于我项目上的建议吗?
tikazyq
2019-06-09 16:53:25 +08:00
单个网站来说不错,可以考虑一下用同样的框架扩展到其他社交平台,这样就强大得多了
waibunleung
2019-06-09 17:47:43 +08:00
@tikazyq 谢谢你的建议,我会认真考虑一下的,十分感谢~!
fenghuang
2019-06-09 19:11:28 +08:00
楼主您好,能介绍一下整个开发流程吗?我现在写爬虫只写了一个 py 文件,感觉不成体系
nondanee
2019-06-09 19:31:42 +08:00
看了下 usage 感觉不像爬虫像 SDK 啊,要不你改个名吧😂
waibunleung
2019-06-09 20:26:32 +08:00
@nondanee 那我改成什么比较好?或者你印象中爬虫是怎么样的呢?
waibunleung
2019-06-09 20:28:29 +08:00
@fenghuang 首先要有大概的整体逻辑的设计,然后就是模块适当分离,然后公用的部分抽取一下,最后组合起来,大概是这样吧,如果觉得不清晰我们可以再交流。其实我在项目里面放了一个 design.md ,你可以看看~
BlackL
2019-06-09 21:51:04 +08:00
楼主你好,请问你的 InitializerModel 类中_is_auto_constructed 这个属性是起什么作用呢,因为整个类初始化的时候这个属性一直为 False,我也没在其他子类中见到过更改这个属性的,所以想问下这个属性的作用
Takamine
2019-06-09 21:58:35 +08:00
厉害,从分层到代码再到注释,都很漂亮阿。(。ò ∀ ó。)

个人感觉硬是要“鸡蛋里面挑骨头”的话(别打我 233333 ),那我感觉可能不够 pythonic。

可能我是想要看到 @property (干掉 Java 一般的 get,set ),
一些内容返回可以跟 scrapy 返回到 middleware 层一样试试 yield,
提到爬虫,那就什么 async/wait,线程池阿都换上去,
异常有了,日志也不能缺,用装饰器加上些功能。


各位别打我,我对楼主也是服气,楼主带我飞。_(:з」∠)_

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/572013

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX