我打算根据我的查询单词 dump 韦氏词典(merriam-webster dict) 里面的单词对应的发音 wav 文件。 不懂前端技术,所以碰到点问题。

2014-12-01 13:14:43 +08:00
 lsmgeb89
韦氏词典有
免费版: http://www.merriam-webster.com/
收费版: http://unabridged.merriam-webster.com/

要查哪个单词就在 url 尾端加上这个单词就好了,像 doctor,分别是:
http://www.merriam-webster.com/doctor
http://unabridged.merriam-webster.com/doctor

我大概看了下返回的 html,可以 parse 出对应单词的 wav 文件:
例如根据:return au('doctor05', 'doctorship'),然后 au 这个函数的实现在 audio.js 里面,可以得到 doctorship 这个单词的 wav 文件的 url,即:
http://media.merriam-webster.com/soundc11/d/doctor05.wav

关键是免费版的有广告,而且查了一定次数后,就要你付费了。
所以简单的程序不太好处理免费版,而且 unabridged 那个 url,不是 member 不返回的。
我就买了一个月的 member。

问题是我 get 的时候是通过什么把我的 member 信息传给它的,我看了下 cookie,一堆,十几个。我就不知道哪个是关键的了!所以怎么找到那关键的一两个 cookie,或者还有其他什么简单的办法?

打算在 linux 下写个小脚本的,用 curl 配合其他命令就可以了,python 啥的不会。谢谢!
2727 次点击
所在节点    问与答
2 条回复
invite
2014-12-01 14:30:42 +08:00
curl直接保存/发送cookie
lsmgeb89
2014-12-01 14:57:12 +08:00
@invite 你是说我用 curl 模拟登陆,然后保存 cookie,再用这写 cookie 请求就好了?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/150610

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX