首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Bash

# [求助] 用 curl 抓取一个网站,网站有很多分页,但不论怎么指 page=[2-100],抓取的都只是 page=1 的内容...

  •  
  •   Ger2EX · 2018-08-10 09:01:11 +08:00 · 1250 次点击
    这是一个创建于 379 天前的主题,其中的信息可能已经有所发展或是发生改变。

    本人用 curl 抓取http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12内容; 但返回的始终是http://www.gmkfreefonts.com/index.php?letter=a&page=1&res=12的内容;

    浏览器 http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12 可以直接跳转到 page3

    curl -s http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12
    

    小白整了一晚也没整明白,请高手指点 1-2,谢谢!

    5 回复  |  直到 2018-08-10 10:56:15 +08:00
        1
    zhu   2018-08-10 09:20:16 +08:00
    & 在命令行是特殊字符。

    你需要修改为:
    curl -s "http://www.gmkfreefonts.com/index.php?letter=a&page=3&res=12"
        2
    beaconfire   2018-08-10 09:21:09 +08:00
    引号了解一下?
        3
    iwishing   2018-08-10 09:27:49 +08:00
    内容都在 index.php 里面了呀
    比方 aajaxsurrealfreak 字体,在第一页的第一个
    你在第三页的源文件里也能搜到
        4
    presoul   2018-08-10 09:30:38 +08:00 via Android
    可以直接 f12 里面 copy as bash url
        5
    Ger2EX   2018-08-10 10:56:15 +08:00
    谢谢各位! OK
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2069 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 19ms · UTC 12:00 · PVG 20:00 · LAX 05:00 · JFK 08:00
    ♥ Do have faith in what you're doing.