github 地址
https://github.com/eatmoreduck/boss-zhipin-scraper
解决了什么痛点
- 字体反爬:BOSS 直聘列表页的薪资是字体文件加密过的,直接抓 DOM 拿到的是假数据。这个工具走的是搜索 API ,接口本身就返回明文
salaryDesc,绕过字体那一层。 - 手动翻页太累:想批量看一类岗位、横向对比薪资和技能要求,靠人工翻根本看不全面。
- 不知道市场行情:光看一两个岗位没感觉,想看整体分布(薪资区间、经验/学历要求、高频技能词)。
技术上怎么做的
没有用 Selenium / Playwright ,而是通过 Chrome DevTools Protocol 直接连接本地一个已登录的 Chrome (持久隔离 profile ,不动你主浏览器的 Gmail / GitHub 登录态):
- 复用真实登录态调搜索 API ,拿到明文薪资
- 详情页带上列表 API 的
securityId/lid上下文,避免风控 - 每页抓完立刻落盘 + 按 job_id 去重,中途崩了不丢数据
- 输出 JSON / CSV ,CSV 还会单独导一份详情表方便 Excel 筛选
抓完之后
跑一份聚合摘要:
- 薪资区间分布、经验/学历要求、地区分布
- 高频公司、技能标签、JD 高频词
- 最后生成一段可直接复制的提示词,丢给 ChatGPT / Claude 帮你做简历关键词补齐、项目经历改写方向、面试准备清单
提示词只基于岗位数据.
仅供交流,个人使用无问题,爬取频率慢,大大降低风控频率
如果觉得有用,给个 ⭐ 就是最大的鼓励。有任何使用问题或想法欢迎在下面留言或者直接在 github 提 issue https://github.com/eatmoreduck/boss-zhipin-scraper/issues 。