需求是匹配除了类似于 don’t 中的 ’,以及 red-moon 中的 - 之外的所有中英文标点符号,这个正则表达式该如何写?
求指点,谢谢!
求指点,谢谢!
1
ljbha007 Apr 24, 2013
百分号呢
|
2
ljbha007 Apr 24, 2013
还有@呢?
|
4
rrfeng Apr 24, 2013
枚举出来,写进[]里。
|
5
ljbha007 Apr 24, 2013
/([\[\]\,.?"\(\)+_*\/\\&\$#^@!~`]|(?!\s)'\s+|\s+'(?!\s)|(?!\s)"\s+|\s+"(?!\s))/
用javascript测试成功 |
6
ljbha007 Apr 24, 2013 |
7
lfocy Apr 24, 2013
/\b[^'-]\b/gmi
|
12
lululau Apr 24, 2013
CJK 标点的 Unicode 代码范围: 0x3000 ~ 0x303F ,不知能是否符合所谓“中文标点”的需求。。。
|
13
rrfeng Apr 24, 2013
|
14
lululau Apr 24, 2013
perl -e 'print pack("c*", 0x30, $_) for (0 .. 0x3F); print "\x00\n"' | iconv -f UTF-16BE
其实需要你的需求方先给出所谓“中文标点符号”的定义 |
15
lululau Apr 24, 2013
发现还些标点符号不在 0x3000 ~ 0x303F 这个区域。。。
比如还有:0xFF00 ~ 0xFF61。。。 |
17
xhj OP |
18
rrfeng Apr 24, 2013
|