[项目制] 团队招一名 Python 爬虫(偏架构优化与工程化,无需复杂逆向)

5 月 5 日
 CycloneJJoker

[项目背景]

我们目前有一套成熟的 Python 爬虫基础源码,并提供稳定可靠的代理池。现有系统已支持历史回溯爬取和增量爬取,状态管理(失败重试、死信队列、断点续爬等)目前全部依赖 PostgreSQL 。 随着业务发展,我们需要一位靠谱的工程师来接手现有代码,进行架构的稳定性升级、日常维护以及数据入库工作。

[工作职责]

[岗位要求]

[合作与结算方式]

有意向的佬可以发送简历到邮箱 contact@shijiedata.com ,主题为:V2EX-Python 爬虫,同时写上个人联系方式( qq/wx 均可),我们会主动添加联系。

907 次点击
所在节点    外包
1 条回复
ttszuo
5 月 8 日
刚好看到,技术栈很匹配。

做过:
- 基于 curl_cffi 的高并发采集引擎( TLS 指纹伪装,自动翻页+去重+断点续爬)
- async + aiohttp 异步架构,并发量可控
- PostgreSQL 状态管理(死信队列 + 重试策略 + 增量同步)
- Redis 用作任务队列和去重缓存
- 常见反爬对抗( UA 轮换、IP 代理池、JS 逆向基础)

你们还提供 Codex —— 我一直用 GPT-5.5 + Codex 辅助开发,效率翻倍。

项目制结算没问题,邮件随后发。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1210324

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX