有木有大牛能帮忙写一个小小的脚本?批量保存内容的。。。

2013-06-25 00:26:33 +08:00
 lazycat
是这样,高考成绩最近不是出来了么,我想要把我们学校同学的成绩都下载下来。。。手动太麻烦了,所以问问大牛们能不恩呢该帮帮我写一个小脚本,批量把内容下载下来。
页面是 http://www.sjzjyksxx.com.cn/exam/depts/result.aspx?id=1&zid=1 很简单的一个页面,一个输入框一个按钮,考生号从 13130105150000 到13130105150620 如果能把内容全部放在一个表格中分类放好或者弄到一个数据库中当然最好,如果不行的话哪怕另存为一大堆文件(文本或者HTML),以姓名为文件名也可以接受。。。
脚本么 本人Linux和Windows的服务器都有,PHP或者写的小程序或者SH或者BAT脚本都可以的。。。其他语言写的也可以,我可以装运行环境的。。。

先谢了~
3367 次点击
所在节点    程序员
7 条回复
vibbow
2013-06-25 00:47:08 +08:00
我又想用万能的Selenium了,怎么破...
pityonline
2013-06-25 00:59:11 +08:00
for i in {1000..1999}; do wget http://www.test.com/xxx.aspx?id=${i}&zid=${i}; done
手机打的,自己看着改吧,想直接取内容可能需要 iconv 转换一下再 grep 成绩关键字,再重定向一下也可以……
binux
2013-06-25 01:26:10 +08:00
for i in {0..620}; do a=`expr 13130105150000 + $i`; curl -s -d '__VIEWSTATE=%2FwEPDwUKLTkyNzU2NzIyNQ9kFgICAw9kFgICAQ9kFgQCAQ8PFgIeBFRleHQFMOmrmOiAg%2BaIkOe7qeafpeivou%2B8iOS7hemZkOefs%2BWutuW6hOW4guiAg%2BeUn%2B%2B8iWRkAgMPDxYCHwAFDOiAg%2BeUn%2BWPt%2B%2B8mmRkZJF4D5%2BJKIzL6NRRoQbMxKeIMTin&__EVENTVALIDATION=%2FwEWBQKS3KfXCQLEuKKdAwKln%2FPuCgK17cLhAQKyt7rPBEXzvHlNLLgUsV4%2Bo4evX8%2BW1ikj&tbZKZ='$a'&btnSearch=%E6%9F%A5+%E8%AF%A2&hfID=1&hfZID=1' 'http://www.sjzjyksxx.com.cn/exam/depts/result.aspx?id=1&zid=1' | grep '<td bordercolordark=' | awk '{ if (NR%2==0 && NR!=8) print }' | sed -E 's/[^>]+> *([^ <]+) *<.*/\1/' | awk -v ORS=" " '{ print }' && echo -e ""; done
binux
2013-06-25 01:30:58 +08:00
| sort -k13nr | head -n10
lecher
2013-06-25 01:59:33 +08:00
@binux 运用的好熟练,统计完的最高分是697
lazycat
2013-06-25 09:58:52 +08:00
@binux 谢了,回家了试试。现在在学校,嘿嘿。。。
linuxer
2013-06-25 14:55:15 +08:00
在Firefox 21.0下看3L的代码都撑开容器出现水平滚动条了。感觉还是写成.reply_content { word-break: break-all;}好点。让这些非“正常”的字符也换行。@Livid

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/73504

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX