如何过滤特殊文件名

2017-07-29 13:11:01 +08:00
 domino
请问如何过滤爬虫爬回来,有特殊符号的标题的数据呢,
想用标题建立文件夹,
但有时候会遇特特殊字元无法建立.
除了用 replace , 还有什么方法呢?
2247 次点击
所在节点    Python
7 条回复
ysc3839
2017-07-29 15:12:19 +08:00
CRC32 Hash 后作为文件夹名
yangff
2017-07-29 15:56:19 +08:00
base64 一下非扩展名部分?
lazzyboy
2017-07-29 16:01:42 +08:00
额,没有`fnameescape() ` 么?
techmoe
2017-07-30 00:09:20 +08:00
特殊符号转译呗。。还能有啥办法
domino
2017-07-30 14:27:33 +08:00
如果用 md5 还是 crc 当为文件夹名,这样资料多很难识别.
不知是否可以用排除特殊服号的方式来做?
刚学 python,不是很熟.
AnyOfYou
2017-07-31 00:12:39 +08:00
domino
2017-07-31 00:30:38 +08:00
@AnyOfYou
这篇文章我看过,
不过这样的做法似乎无法保存中文,日文等文件名

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/378818

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX