小白如何利用 python,写一个自动查询的脚本

2016-07-02 23:34:17 +08:00
 chole

工地搬砖狗一名,最近领导让我管理试验用的标准文件,每隔一段时间都需要在工标网上对现有的标准进行搜索,检查现行标准是否有更新。请问如何通过 python 自动重复这一过程?

查询的网址 http://www.csres.com/s.jsp?keyword=GB+18242-2008 GB+18242-2008 是标准文件的标准号 每次都要搜索上百个这样的标准文件

2830 次点击
所在节点    问与答
8 条回复
ZGLHHH
2016-07-02 23:38:25 +08:00
urllib 库
requests 库
正则表达式
chole
2016-07-03 00:10:02 +08:00
@ZGLHHH 能不能给小白一个栗子?
ZGLHHH
2016-07-03 00:15:09 +08:00
@chole
我只能给个逻辑:
第一次爬取->正则表达式将数据分割成一个个数组->存库
之后的爬取->正则表达式将数据分割成一个个数组->当前数据与存库的数据进行比较判断->后续操作
chole
2016-07-03 00:19:32 +08:00
@ZGLHHH ok 谢谢啦 我再摸索摸索
jswh
2016-07-03 00:41:55 +08:00
说真的,这种简单的需求,如果不是为了自己要学习,而是单纯解决问题,猪八戒上稍微花点钱就好了......
liqingcan
2016-07-03 00:42:59 +08:00
花点钱 请别人解决最快
chole
2016-07-03 00:46:30 +08:00
@jswh 哈哈,说得很对,确实主要还是为了学习。一直觉得 python 很有意思,但是缺少学习的动力。
jswh
2016-07-03 00:54:54 +08:00
@chole 学习的话,解决这种问题的基本就是爬虫。可以了解一下 python 爬虫的基本思路,基本找个入门教程跟着做做就好了。然后再针对具体问题,应用爬虫的思路,选择具体的工具来操作。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/289887

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX