请教一个正则表达式,从vcf文件中匹配信息

2011-09-08 21:19:15 +08:00
 icerunz
在两个手机之间倒腾通讯录,结果WM这边出来的是一个csv文件,经过处理之后形成一个集合了1000多个联系人的vcf文件,目标手机只认单个vcf文件(每个联系人一个单独的vcf)。于是就想用正则从多个联系人集合的那个vcf中匹配出来之后另存为单个vcf。

上面啰嗦了半天也不直观,也就是说从类似下面的这个文件中匹配出单个的联系人信息:

BEGIN:VCARD
VERSION:2.1
N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:=E9=98=BF=E6=97=BA=E5=93=E9=99=A2
TEL;CELL:13500000000
END:VCARD

BEGIN:VCARD
VERSION:2.1
N;CHARSET=UTF-8;ENCODING=QUOTED-PRINTABLE:=E9=B4=E5=93=A5
TEL;CELL:13700000000
END:VCARD


也就是以BEGIN:VCARD开头,END:VCARD结尾的信息。
我用PHP写,现在用的表达式是:

$ereg = "|BEGIN:VCARD([\s\S]+?)END:VCARD|";

这样的话结果是两个数组,每个数组里面包含了400多个联系人信息。。。也就是说跨越了很多的END:VCARD才匹配出了一个,查了半天不知道什么原因,特请教


不胜感激。
4841 次点击
所在节点    问与答
23 条回复
args
2011-09-09 23:49:20 +08:00
正则表达是默认是贪婪模式。
noahasm
2011-09-10 02:36:23 +08:00
@icerunz 我最熟的就是 perl,在学 python/objc, 我用 perl 做各种事情,web应用,图表,爬虫,数据库,文本处理,网络通信等
icerunz
2011-09-10 12:52:38 +08:00
@noahasm 恩,领教了。看来语言并不是阻碍应用的直接原因。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/17892

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX