聚合网站如何控制一下外链?

2013-06-19 14:36:43 +08:00
 kenneth
聚合网站,有很多来自与站外的图片链接,我既不想保存,但是又不想有出站链接。
有没有办法将图片全部变成本站链接,但是又不保存图片呢?

代码正则替换呢?还是js层面替换?爬虫会检测到?

求思路,求指点。
3817 次点击
所在节点    程序员
8 条回复
zorceta
2013-06-19 14:53:40 +08:00
example.com/go/{base64encoded}
lichao
2013-06-19 15:56:32 +08:00
爬虫无视 js,1 楼方法可以
takwai
2013-06-19 16:03:04 +08:00
代码里面替换似乎好一些,不过得加一层代理,替换过的链接经代理读回远程的图片数据再返回给客户端?
cloudzen
2013-06-19 16:10:49 +08:00
这样做的目的是什么呢?
takwai
2013-06-19 16:12:31 +08:00
额,不对,犯傻了,代理不需要。

就如一楼说的那方法,解码得出真实地址后,直接在代码里面来一句 Redirect 到真实地址就好了。
kaifazhe
2013-06-19 17:15:14 +08:00
图片都转base64,html不是会变的超级臃肿,爬虫更不会喜欢
orzcc
2013-06-20 17:12:21 +08:00
图片地址加密赋值给img的某一个属性xx(非src),用lazy load的原理将xx值解密,然后赋值给src。
yaotian
2013-06-25 17:17:47 +08:00
@zorceta
@takwai 如果这种方式,用301, 还是302 Redirect呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/72891

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX