盗版小说站的内容被替换成了反义词,这是什么技术

301 天前
 Lightbright
如题,很久前看小说时就发现有的网站内容存在这个问题,
今天又遇到了,咱就是说,这也太缺德了吧



注意到一些常见词都变成反义词了:
快->慢
进->退
上->下
多->少
高->低
不->是
前->后
特殊->普通

这到底是哪位人才想出来的办法,
污染的来源是哪里,起点嘛。。。
5114 次点击
所在节点    分享发现
33 条回复
mmxq
301 天前
这个不是污染吧,就是那些小网站为了规避审核和正版平台的防盗整出来的。
之前就有人说过这事儿了。
blockmin
301 天前
搞盗版的人的正版网站账号被风控,出现替换文字,盗版 copy 过来又没校对,就这样了。
正版搞防盗,盗版没校正
biquzhi
301 天前
字体反爬吧
cairnechen
301 天前
@blockmin 搞盗版的人的账号咋风控啊,应该不会蠢到所有书付费订阅都用同一个账号吧
NoOneNoBody
301 天前
厉害,中国人真不缺点子 🐶
Ansen
301 天前
@cairnechen 盗版都是你抄我,我抄你
huguadao
301 天前
尼玛,还真是,搞得都么有看下去的欲望了
cairnechen
301 天前
@Ansen 他的意思是,盗版网站通过付费订阅拿到最新章节内容,然后通过 OCR 之类的方式拿到文本,正版网站是通过风控找到这个付费订阅的账号,然后替换掉这个账号看到的章节内容,我说的是这个过程
yyzh
301 天前
正版的防盗版措施吧。某点也是这样,某些字莫名其妙用了繁体的
blockmin
301 天前
@cairnechen #4 标点符号,特殊字符,还有一些其他的方式检测的,盗版个几章就能定位到账号了,这个时候找客服申述,提供手持照就能解
Jirajine
301 天前
这样搞不怕出现政治问题么,作者写了一句赞歌,你给他替换成了反义词,那怕不是要直接被举报了。
yfugibr
301 天前
原站把对应的字符编码互换(所以盗版网站爬到的字是反的),同时把对应的字体外形也互换(所以原站上看起来是正常的)
iamee
301 天前
如果你们爬过美团、大众点评等网站,就会发现这点反爬手段只能算是入门级~
rming
301 天前
@yfugibr #12 好思路
Lightbright
301 天前
@yfugibr 单个字符可以这样解释,但他这个还有词语的反义词
yfugibr
301 天前
@Lightbright #15 具体没研究过,但是好像也能做到替换多个连续字符的显示内容。

见过一个编程字体,可以把 --> 替换成一个 ⇨,拆开时每一个字符都是正常显示,同理应该也能做到将”特殊“的字符编码作为一个整体显示为”普通“。
shinession
301 天前
是的, 所以我很久没用过盗版的了, 而且它这个反义词还不是针对所有的, 有一定的比例, 全部替换也是读不通, 中国人鬼点子多
yfugibr
301 天前
kkocdko
301 天前
没人理会的 3 楼大概率是正解。
kkocdko
301 天前
抱歉看到了,还是有人理会的 hhhhh

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/957035

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX