V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
whatTheGhost
V2EX  ›  Python

写了一个拉勾的爬虫……

  •  
  •   whatTheGhost · 2017-03-12 17:05:19 +08:00 · 3408 次点击
    这是一个创建于 2609 天前的主题,其中的信息可能已经有所发展或是发生改变。
    github 地址:
    https://github.com/whatsGhost/lagou_spider

    总共一百多行代码。
    支持全文搜索;屏蔽公司;设置最低薪资下限,上限;最高薪资下限,上限。
    搜完后会把职位信息和地址写到文本中。

    http://d3.freep.cn/3tb_170312162616uyml583491.png

    昨天下午观摩了下python的语法 ,果然还是人生苦短,要用 python ( ̄ヘ ̄ o #)
    13 条回复    2017-03-13 12:52:37 +08:00
    whatTheGhost
        1
    whatTheGhost  
    OP
       2017-03-12 17:07:27 +08:00
    二楼,杭州, 14 毕业,找一个 C++ 服务端的坑。
    a87150
        2
    a87150  
       2017-03-12 19:04:05 +08:00
    看得出来是写 c++的,居然能把 python 写得这么复杂
    whatTheGhost
        3
    whatTheGhost  
    OP
       2017-03-12 19:33:40 +08:00   ❤️ 1
    @a87150 哈~,这锅甩给 java ,这其实是仿 java ,一个 static main 函数,各种 get/set ……
    Luckyray
        4
    Luckyray  
       2017-03-12 19:43:48 +08:00 via iPhone
    人生苦短你用 Python 写 Java ……
    mianju
        5
    mianju  
       2017-03-12 20:44:17 +08:00
    python 被你这么写也是没谁了
    kozora
        6
    kozora  
       2017-03-12 20:55:53 +08:00
    拉勾拉勾 一百年不匹配的网站爬来有什么意义。。
    BoBoy
        7
    BoBoy  
       2017-03-12 20:59:04 +08:00 via iPhone
    拉勾就是垃圾,有啥好爬的。
    defunct9
        8
    defunct9  
       2017-03-12 22:18:44 +08:00 via iPhone
    scrapy 弄弄就好了吧,简单复杂化了
    julyclyde
        9
    julyclyde  
       2017-03-12 23:01:02 +08:00
    经 @whatTheGhost 点拨,加上我一点点 java 粗浅的功底(我还是知道 java 程序的入口在哪儿的!!)我居然明白了
    staticmethod decorator 的意思
    figofuture
        10
    figofuture  
       2017-03-13 09:42:47 +08:00
    mark
    justfun
        11
    justfun  
       2017-03-13 10:56:32 +08:00
    javathon ==
    whatTheGhost
        12
    whatTheGhost  
    OP
       2017-03-13 11:05:26 +08:00 via Android
    @justfun ,不要在意这些细节Σ( ° △ °|||)︴
    siteshen
        13
    siteshen  
       2017-03-13 12:52:37 +08:00
    这年头,爬一个页面的程序都能叫爬虫…
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2367 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 07:25 · PVG 15:25 · LAX 00:25 · JFK 03:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.