如何用 jsoup 抓取下面这个网页的表格数据, http://www.gxyxzb.gov.cn/guawang_sys/index_gw.asp?guawangid=FCK16514920160625t

2016-09-12 16:49:34 +08:00
 caiyaogege
抓了好久没抓到,求大神指点迷津! jsoup 抓取网页内容, http://www.gxyxzb.gov.cn/guawang_sys/index_gw.asp?guawangid=FCK16514920160625t
2049 次点击
所在节点    程序员
2 条回复
ss098
2016-09-12 17:08:05 +08:00
我看了一下,真实内容是套在 iframe 里的,向你提供一个 PHP 版的思路,注意 URL 不一样:

echo file_get_contents("http://www.gxyxzb.gov.cn/guawang_sys/guawang_tables.asp?guawangid=FCK16514920160625t")

然后呢你就可以在前端 / 后端解析表格了。
zerowxxyf
2016-09-13 09:22:34 +08:00
第一次请求页面后有通过 flash 进行 UA 验证和 cookie 设置,验证通过之后才能看到数据,建议找个内置浏览器内核的库。验证地址:http://172.16.254.50:89/cookie/flash.js

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/305717

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX