先估价:把这个 flash 网页里的文本取出来

2020-06-13 06:35:16 +08:00
 buptrobin
http://c.gb688.cn/bzgk/gb/showGb?type=online&hcno=BCD97A1A4C06AF7DA3AC4DEEC92B113A

可能最终会有上千个文档。所以最终需要一个小程序来干。

先估个价,我好跟甲方谈。
603 次点击
所在节点    外包
6 条回复
mrant
2020-06-13 09:33:28 +08:00
你的源数据都是这个网站上的吗,还是可能有别的 flash
lxk11153
2020-06-13 09:52:22 +08:00
还有解密。 感觉可以做 call cXEvd3g6IDQ0Mzk3NDE1OQ== (b​a​s​e​6​4)
mrant
2020-06-13 09:57:30 +08:00
http://www.biaozhun8.cn/ 这里不是能下载
coolrice1
2020-06-13 10:03:29 +08:00
下载成 pdf 行不?
coolrice1
2020-06-13 10:15:04 +08:00
提取纯文字可能要 ocr,v: Y29vbF9yaWNl (base64)
lxk11153
2020-06-13 11:16:43 +08:00
append #2 已下载好 BCD97A1A4C06AF7DA3AC4DEEC92B113A

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/681146

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX