关于文章内容混淆的一个设想

2019-05-14 21:50:02 +08:00
 xiaoz

比如博客或者网站的某些内容是会被监控的(你懂的),于是有一个设想。

  1. 假如在读取数据库之后将内容进行一次 base64 编码(或者再次 unicode 一次),那么 HTML 内容是 base64 转码后的。
  2. 然后通过 js 将 base64 解码,不影响正常用户访问阅读内容,是否这样就不会被机器识别到内容了。
  3. 或者自己写一个可逆的加密算法,输出的 HTML 内容加密,js 渲染的时候解密。

哈哈哈,不知道行得通不。

2033 次点击
所在节点    问与答
11 条回复
mario85
2019-05-14 23:30:45 +08:00
哪需要这么麻烦,遇到敏感的东西就用那个“汉字序顺并不定一影阅响读”的原理好了,保证各种 NLP 都无法正常识别
JinChen
2019-05-14 23:34:25 +08:00
可以的,也确实有些敏感网页会这么操作。
tyrealgray
2019-05-14 23:35:22 +08:00
其实关键在于你人要在墙外 (狗头
grimpil
2019-05-14 23:37:23 +08:00
之前也有过这样的想法,应该可以做到吧
GeruzoniAnsasu
2019-05-14 23:42:04 +08:00
可以了解下这种东西
/t/553248
opengps
2019-05-15 00:32:09 +08:00
你想做的。哪些垃圾违法站已经帮你实践了
Tink
2019-05-15 00:56:29 +08:00
监控不都是监控最终渲染或者解密出来的版本吗
limingjie138
2019-05-15 02:52:00 +08:00
@Tink 有搜索引擎那种大爬虫要百度何用,应该都是网络层截下来的
silencefent
2019-05-15 08:46:39 +08:00
老大哥肯定考虑到了网页编码这个问题,除非你外挂一个解密脚本,付费会员可用
zwh2698
2019-05-15 09:37:30 +08:00
1.其实我想知道你怎么区别人和机器人浏览? 2.我想知道你的太复杂的时候,行政命令和法律是否你能扛得住?没有了
iamshit
2019-05-15 11:05:35 +08:00
某些文字 直接用图片代替,最好使用一些不太好识别的字体,应该会极大的增加识别难度 😋

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/564172

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX