防止被 wget -c -k -r -np -p或者像网页模板小偷采集,有什么方法
1
FrankFang128 2015 年 6 月 11 日 via Android
把内容写在CSS里,使用你自己特制的字体,比如『我』的Unicode 码对应你
|
2
superliang 2015 年 6 月 11 日
加干扰码或者异步加载内容,不过不管怎么防止采集对搜索引擎都不友好
|
3
banri 2015 年 6 月 11 日 via iPhone
直接来源不就行了,妈妈再也不用担心被采集啦!
说真的都写前端了,就不要担心扒皮的事儿,因为100%可以被扒皮啊… |
4
banri 2015 年 6 月 11 日 via iPhone
:D 打错了是开源
|
5
kisshere 2015 年 6 月 11 日 via Android
全部用js生成模板
|
6
binux 2015 年 6 月 11 日 via Android
没有办法
|
7
lwbjing 2015 年 6 月 11 日
canvas重绘。。
|
8
endoffight 2015 年 6 月 11 日
js模板 selenium直接秒杀
|
9
typcn 2015 年 6 月 11 日
修改 nginx 配置,listen 80 改成 listen 127.0.0.1:80
|
11
learnshare 2015 年 6 月 11 日 后端直接渲染成图片
|
12
seerhut 2015 年 6 月 11 日
只要字体规整,图片也能高效ocr....
|
13
gangsta 2015 年 6 月 11 日
|
14
Busy 2015 年 6 月 11 日
不可能,综上
|
15
onlyice 2015 年 6 月 11 日 via Android
Canvas....
|
16
johnsmith123 2015 年 6 月 11 日
怎么防止我发到网上的东西不会被复制?
|
17
liujiantao 2015 年 6 月 11 日 via Android
看看我这个 /t/157243
|
18
kokdemo 2015 年 6 月 11 日
……我觉得这只是增加了采集的门槛
但是也够了 |
19
thankyourtender 2015 年 6 月 11 日
日他,正面刚他,
|
20
Andy1999 2015 年 6 月 11 日 via iPhone
屏蔽外部IP
|
22
mcone 2015 年 6 月 11 日
没办法 很难
百度知道现在的做法是,如果你ip访问频率过高,会随机替换一段话中的某几个字,用图片显示,这样你采集到的文字就是不完整的奇奇怪怪的 |
24
amxku 2015 年 6 月 11 日
其实还是有一些办法的,除了频率外,比如判断访问路径,是否加载了资源文件等等,就看你这数据是不是值得花这么大成本去做
|