美丽说这样的地址可以抓取么?

2013-01-28 14:07:07 +08:00
 asing
例如
http://www.meilishuo.com/share/842617785?sn=aspn&wzz=p0r0c1

右侧的“去购买”点击后跳转到淘宝链接,有办法可以把淘宝链接读取出来么

curl试了,不行
感谢
3599 次点击
所在节点    程序员
11 条回复
sobigfish
2013-01-28 14:12:41 +08:00
asing
2013-01-28 14:29:40 +08:00
@sobigfish 能说下思路么
sobigfish
2013-01-28 14:41:31 +08:00
这个地址就在你的贴的那个页面里啊,那么多`去购买` 都有这个地址,貌似这个最容易采集 <a class="price_go" href,而且那个页面里的js也有定义
url
asing
2013-01-28 14:53:50 +08:00
嗯,我就是在centos上 执行了下,也得到了
<script>
function goURL( goUrlStr ) {
if ( typeof(goUrlStr) != 'undefined') {
var isIe=(document.all)? true : false;
if(isIe) {
var linka = document.createElement('a');
linka.href = goUrlStr;
document.body.appendChild(linka);
linka.click();
} else {
window.location = goUrlStr;
}
}
return true;
}
</script>
<body><script>goURL('http://www.77169link.com/go/?t=18616859973&u=http%3A%2F%2Fitem.taobao.com%2Fitem.htm%3Fid%3D18616859973');</script></body>


你说的是那个页面的js有定义URL?
DKR
2013-01-28 15:49:33 +08:00
正好刚刚也在用curl 需要伪装一个http请求 参数
CURLOPT_USERAGENT, $_SERVER['HTTP_USER_AGENT']
这样就可以了
qiongqi
2013-01-28 16:41:36 +08:00
抓这个有什么用啊?每个淘宝客id对应的链接都是不一样的啊
sobigfish
2013-01-28 17:08:09 +08:00
@qiongqi 查了查 http://api.taobao.com/apitools/apiTools.htm?catId=4&apiName=taobao.item.get 貌似确实是啊 num_iid
请问怎么区分track_iid和num_iid
asing
2013-01-29 15:10:31 +08:00
@qiongqi 什么意思?淘宝客id去除掉不是可以得到原始的url么?

我然后再加上我的不行么?
qiongqi
2013-01-29 18:10:40 +08:00
@sobigfish 不清楚,没做过这块。应该都是api返回的吧,返回什么用什么
qiongqi
2013-01-29 18:13:09 +08:00
@asing 你试试吧,我觉得不行,淘宝客的url都是通过一些算法加密过的。都这么简单能拼出来的话,还给每个appkey设置调用限制干嘛?
gfreezy
2013-01-29 22:20:29 +08:00
用淘宝的api可以转换淘宝客链接,不过现在只支持客户端转换,就是用淘宝提供的JS SDK来转了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/59034

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX