最近采集数据碰到的问题:对方网站用了自定义字体防采集 求 Java 破解方法

2018-08-22 11:08:48 +08:00
 xe2vxe2v

目前网上好像只给出了 python 的解决方式 -->https://www.jianshu.com/p/79c4272c0969 其中用到了 fonttools 库提取字体,不知道有没有大佬有 java 解决方案

2145 次点击
所在节点    程序员
5 条回复
huxiaohaiyang
2018-08-22 12:39:57 +08:00
只是数字吧,不用实时解析字体,看下字符集,写好对应规则转换就行了
JCZ2MkKb5S8ZX9pq
2018-08-22 18:25:26 +08:00
有点意思。不过只要转换一下就好了,啥语言都不难吧。
另外,人家这么防着了,尊重一下 robots 协议啊……
xe2vxe2v
2018-08-22 19:08:27 +08:00
@huxiaohaiyang 想做一个实时解析的 这样就不用改代码了
xe2vxe2v
2018-08-22 19:11:13 +08:00
@JCZ2MkKb5S8ZX9pq java 好像没有解析如. woff 字体文件的类吧?
JCZ2MkKb5S8ZX9pq
2018-08-23 02:50:54 +08:00
@xe2vxe2v 不用解析吧……你手动下载字体文件,看看改了啥映射,自己写个映射就好了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/482099

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX