V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
fghfjujiber
V2EX  ›  问与答

想写一个新闻爬虫,没做过后端,只写过简单的 PHP,怎么入手?

  •  
  •   fghfjujiber · 2015-06-23 18:28:28 +08:00 · 2222 次点击
    这是一个创建于 3235 天前的主题,其中的信息可能已经有所发展或是发生改变。

    看了一下好像大部分都用Python,也有PHP的,还有现在的爬虫框架成熟吗?那直接调用的话开发应该很快吧?

    7 条回复    2015-06-24 10:09:58 +08:00
    xmbaozi
        1
    xmbaozi  
       2015-06-23 18:39:56 +08:00
    pyspider
    lonelygo
        2
    lonelygo  
       2015-06-23 18:48:09 +08:00
    @fghfjujiber 我貌似也有和楼主一样的想法,问题是,我啥端都没弄过😢。
    python看了几天学习了下语法。
    git找了个爬虫看了看代码,貌似框架成熟,关键是怎么分布,怎么处理反爬,怎么找免费代理,当然了,分析网页是基本能力。
    LZ,一起玩呗(本人基本工作后就没碰过代码,有点汇编的底子)。
    thanksir
        3
    thanksir  
       2015-06-23 18:58:16 +08:00
    python的话可以考虑pyspider、pyquery、scrapy
    php可以考虑phpquery
    比较而言,python更适合做爬虫
    yytsjq
        4
    yytsjq  
       2015-06-23 18:59:01 +08:00
    PHP Simple HTML DOM Parser
    fghfjujiber
        5
    fghfjujiber  
    OP
       2015-06-24 09:47:20 +08:00
    @lonelygo 可以哦!约起!
    fghfjujiber
        6
    fghfjujiber  
    OP
       2015-06-24 09:47:36 +08:00
    那看来还是python比较适合哦!
    lonelygo
        7
    lonelygo  
       2015-06-24 10:09:58 +08:00
    @fghfjujiber 哈,约。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2201 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 10:12 · PVG 18:12 · LAX 03:12 · JFK 06:12
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.