V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
GPU
V2EX  ›  问与答

有什么工具可以文本输出中处理 javascript 获取处理后的页面结果

  •  
  •   GPU · 2014-06-05 14:56:39 +08:00 · 2095 次点击
    这是一个创建于 3632 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有人明白我的意思吗?

    一个页面 他的页面结果是通过javascript 生成的内容 , 然后怎么通过 php 或者 shell 等等方式获取我要的内容 .


    也就是通过各种程序语言 , 抓取到浏览器生成的内容. 输出到txt
    5 条回复    2014-06-06 21:29:33 +08:00
    rannnn
        1
    rannnn  
       2014-06-05 15:03:58 +08:00
    PhantomJS
    imn1
        2
    imn1  
       2014-06-05 16:02:41 +08:00
    凡是有js引擎的都可以,v8(php有这个),nodejs……
    caomu
        3
    caomu  
       2014-06-05 17:01:14 +08:00
    除了用js引擎模拟,也可以看看js具体了做什么,比如它是ajax从后端拉来了数据,就模拟请求然后本地解析处理,如果是对当前dom处理输出,就扒了页面html然后本地解析处理。一个想法,不一定对。
    jerray
        4
    jerray  
       2014-06-06 11:56:06 +08:00
    参见 seleniumhq http://docs.seleniumhq.org/

    实际上这东西就是开个浏览器,给开发者提供了操作浏览器的接口。
    GPU
        5
    GPU  
    OP
       2014-06-06 21:29:33 +08:00
    @rannnn
    @imn1
    @caomu
    @jerray
    各位谢谢啦 。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5802 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 06:41 · PVG 14:41 · LAX 23:41 · JFK 02:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.