V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
tms
V2EX  ›  问与答

有什么办法可以用代码模拟用户的浏览行为么。

  •  
  •   tms · 2016-08-12 18:12:31 +08:00 via Android · 1244 次点击
    这是一个创建于 2827 天前的主题,其中的信息可能已经有所发展或是发生改变。

    遇到一个模拟用户浏览行为的需求,今天研究了一下 ghost.py ,似乎可以做到,但是不太完美。

    看了一下目标页 network ,有时长统计,就是每隔几秒调用一次 jsonp 请求一个接口。还有一些用户行为检测,比如正常用户的点击量和页面访问时长和 pv,uv 的比值等等。

    这样看来至少必须要支持 js 解析。一些简单的爬虫就不行了。直接用浏览器+脚本控制又太重。

    问题来了,有没有更好的办法或者库可以用来写个类似爬虫的程序模拟用户的浏览行为。又可以支持js等的正常解析。

    6 条回复    2016-08-13 10:19:08 +08:00
    bdbai
        1
    bdbai  
       2016-08-12 18:23:23 +08:00 via Android   ❤️ 1
    PhantomJS!
    关键词 headless browser
    RangerWolf
        2
    RangerWolf  
       2016-08-12 18:25:51 +08:00   ❤️ 1
    selenium
    tms
        3
    tms  
    OP
       2016-08-12 18:26:49 +08:00 via Android
    @RangerWolf selenium 我看了。似乎还没有 ghost.js 好用。
    tms
        4
    tms  
    OP
       2016-08-12 18:27:00 +08:00 via Android
    @bdbai 好的我看看这个。谢谢
    RangerWolf
        5
    RangerWolf  
       2016-08-12 22:38:29 +08:00
    @tms 真的吗? 我只用过 selenium~ 我来试试看 ghost.js
    tms
        6
    tms  
    OP
       2016-08-13 10:19:08 +08:00
    @RangerWolf 额。是 ghost.py 。手误了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3648 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 04:52 · PVG 12:52 · LAX 21:52 · JFK 00:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.