我想用Python写个自动为当前目录下面的视频文件搜索并下载射手网字幕的小脚本,求指引

2012-10-29 17:43:06 +08:00
 tedd
Python大概知道怎么回事,但没有实际应用过,这次正是个好机会,请问大概需要怎么下手呢,用urllib2?我下面的伪代码如何:

先来现在目标目录下面的文件作为例子

Dexter.S07E05.HDTV.x264-ASAP.mp4
Downton.Abbey.3x07.HDTV.x264-FoV.mp4
Misfits.4x01.HDTV.x264-FoV.mp4
The.Good.Wife.S04E05.HDTV.x264-LOL.[VTV].mp4

1、读取到所有文件名
2、用正则表达式将剧集实际名字读出来(这貌似要想一下怎么匹配,我看出的是'英文+数字',譬如S0之前的应该就是剧集名字)
3、将剧集名称放到射手网的搜索链接中去,http://shooter.cn/search/Downton+Abbey/(貌似射手网没有公开的api可以调用,只有通过这种方式吧?)

剩下的貌似就复杂了,又得用正则将搜索出来的结果筛选出来?然后进入该页面,模拟点击下载按钮?
4000 次点击
所在节点    Python
4 条回复
holmesabc
2012-10-29 17:45:45 +08:00
应该是用requests + pyquery,简单点吧
tedd
2012-10-29 17:47:53 +08:00
@holmesabc 谢谢,都没有听说过,我搜搜看看去
csx163
2012-10-29 18:29:14 +08:00
@RavagerAlpha
这位大师好像写了一个,你可以参考一下

http://www.v2ex.com/t/51077
duhastmich
2012-10-30 11:13:33 +08:00
有个submarine,通过checksum 来的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/51196

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX