V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
IFoon
V2EX  ›  问与答

什么工具可以提取文本中的手机号

  •  
  •   IFoon · 2014-09-15 23:50:43 +08:00 · 4431 次点击
    这是一个创建于 3523 天前的主题,其中的信息可能已经有所发展或是发生改变。
    文本中什么都有,特别乱,我想提取里面的手机号。
    现在我下载了一个EmEdior的编辑器,正则式也写好了,在替换的时候老是不能替换成功,不知道为啥?
    大家有没有这方面的工具,可以提取文本中任意想要的字符,然后剔除掉多余不想要的字符,有这样的工具吗?
    谢谢!
    11 条回复    2014-09-17 10:27:45 +08:00
    zhs227
        1
    zhs227  
       2014-09-16 01:33:12 +08:00
    最好的办法是写个程序,用文本编辑器替换容易,但是想把找到的东西单独留下来不太容易。
    一般程序都有个match_all的功能,查找一下就把所有的结果放到数组,一个一个输出来就OK。
    IFoon
        2
    IFoon  
    OP
       2014-09-16 08:02:45 +08:00
    @zhs227 是啊,我开始的时候也是想写但是懒癌缠身,看来还是得写。
    jianghu52
        3
    jianghu52  
       2014-09-16 09:08:58 +08:00
    你的正则是什么。发出来看看啊。一般来说如果是手机号的话很好辨识的啊,不太容易同其他东西混淆,除非你里面还有超过13位的大数字。
    IFoon
        4
    IFoon  
    OP
       2014-09-16 09:42:51 +08:00
    @jianghu52 /13[123569]{1}\d{8}|15[1235689]\d{8}|18[1234689]\d{8}/
    binux
        5
    binux  
       2014-09-16 10:21:57 +08:00
    @IFoon 你这个14位的数字也会被识别成手机号
    jiyee
        6
    jiyee  
       2014-09-16 14:35:21 +08:00
    @binux 正则表达式不能表意,这样的情况需要你先去评估要替换的文本,会不会出现14位连续的数字情况,不然没有绝对的答案。
    mhycy
        7
    mhycy  
       2014-09-16 17:19:46 +08:00
    学Python就好了,对于这些东西,几行代码的事
    Python很适合这些应用场合
    viowan
        8
    viowan  
       2014-09-16 17:38:55 +08:00
    php几句代码就能搞吧。
    file_get_contents+preg_match_all+file_put_contents
    IFoon
        9
    IFoon  
    OP
       2014-09-17 10:27:09 +08:00
    @jiyee 嗯。
    IFoon
        10
    IFoon  
    OP
       2014-09-17 10:27:24 +08:00
    @mhycy 已经用PHP做完了。
    IFoon
        11
    IFoon  
    OP
       2014-09-17 10:27:45 +08:00
    @viowan 是,已经用这几个函数搞定了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4385 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 05:21 · PVG 13:21 · LAX 22:21 · JFK 01:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.