分享关于 URL 正则识别以及 URL 的可读写性的经验和体会

2014-02-15 02:00:49 +08:00
 Weakdancer
关于URL正则匹配的问题是个普遍问题。可以找到大量的例子,我从我自己的网站出发来分享一下关于正则的体会。
首先是一个例子:
http://www.rubular.com/r/YlWJbzVANT

可以看到这个正则主要是利用用户自觉的在URL末尾加空格或者换行来识别的。这个思路似乎和V2EX现在使用的思路相似。

就像我这里 http://www.v2ex.com/t/99515#reply12 提到的一样,似乎是有一个问题存在的,我暂时不能很好的表述,只提供一个现状供大家参考:

http://myswap.sinaapp.com/wd/URL%E5%8F%AF%E8%AF%BB%E5%86%99%E6%80%A7
http://myswap.sinaapp.com/wd/URL可读写性

URL的可读写性应该是非英语国家的人的共同问题吧。
不知我现在的做法是不是提供了一种解决途径呢?
1977 次点击
所在节点    正则表达式
4 条回复
binux
2014-02-15 02:31:54 +08:00
URL又不是没有标准,标准又是正则文法的,为什么要再创造?

http://myswap.sinaapp.com/wd/URL可读写性
在不同的编码的页面中是不同的URL,href可不要用这个
binux
2014-02-15 02:38:05 +08:00
记错,直接点击时path部分以utf8编码,query部分视浏览器不同
http://www.w3help.org/zh-cn/causes/HD9001
Weakdancer
2014-02-15 03:06:28 +08:00
@binux 谢谢提供资料。
我的需求是在书写文章的时候可以避免遇到不能读写的字符。

确实存在很多问题的。
Weakdancer
2014-02-15 03:10:04 +08:00
@binux
比如你写文章的时候是不是做了一些手动工作来让:
http://zh.wikipedia.org/zh-cn/HTTP%E7%8A%B6%E6%80%81%E7%A0%81
变成可读的呢?
我是想节省掉这部分工作。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/100301

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX