爱意满满的作品展示区。
echoX

[开源免费] boss-zhipin-scraper: 基于 CDP 的 boss 直聘爬虫

  •  
  •   echoX · 14h 57m ago · 399 views

    github 地址

    https://github.com/eatmoreduck/boss-zhipin-scraper

    解决了什么痛点

    1. 字体反爬:BOSS 直聘列表页的薪资是字体文件加密过的,直接抓 DOM 拿到的是假数据。这个工具走的是搜索 API ,接口本身就返回明文 salaryDesc,绕过字体那一层。
    2. 手动翻页太累:想批量看一类岗位、横向对比薪资和技能要求,靠人工翻根本看不全面。
    3. 不知道市场行情:光看一两个岗位没感觉,想看整体分布(薪资区间、经验/学历要求、高频技能词)。

    技术上怎么做的

    没有用 Selenium / Playwright ,而是通过 Chrome DevTools Protocol 直接连接本地一个已登录的 Chrome (持久隔离 profile ,不动你主浏览器的 Gmail / GitHub 登录态):

    • 复用真实登录态调搜索 API ,拿到明文薪资
    • 详情页带上列表 API 的 securityId / lid 上下文,避免风控
    • 每页抓完立刻落盘 + 按 job_id 去重,中途崩了不丢数据
    • 输出 JSON / CSV ,CSV 还会单独导一份详情表方便 Excel 筛选

    抓完之后

    跑一份聚合摘要:

    • 薪资区间分布、经验/学历要求、地区分布
    • 高频公司、技能标签、JD 高频词
    • 最后生成一段可直接复制的提示词,丢给 ChatGPT / Claude 帮你做简历关键词补齐、项目经历改写方向、面试准备清单

    提示词只基于岗位数据.

    仅供交流,个人使用无问题,爬取频率慢,大大降低风控频率

    如果觉得有用,给个 ⭐ 就是最大的鼓励。有任何使用问题或想法欢迎在下面留言或者直接在 github 提 issue https://github.com/eatmoreduck/boss-zhipin-scraper/issues

    5 replies    2026-07-04 04:29:04 +08:00
    fankcoder
        1
    fankcoder  
       14h 42m ago
    严肃学习
    feiniu
        2
    feiniu  
       13h 47m ago
    爬取量大了会不会封账号
    s3040608090
        3
    s3040608090  
       4h 16m ago
    看看,之前用过几个 boss cli 直接封号了
    s3040608090
        4
    s3040608090  
       4h 15m ago
    @s3040608090 更正:之前用过几个 boss cli 直接触发风控了
    cskeleton
        5
    cskeleton  
       2h 52m ago via iPhone
    我都是让 codex 视觉爬的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1066 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 54ms · UTC 23:21 · PVG 07:21 · LAX 16:21 · JFK 19:21
    ♥ Do have faith in what you're doing.