首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  程序员

PHP 怎样检测出一个字符串出现次数最多的标点符号?

  •  
  •   kisshere · 96 天前 · 1278 次点击
    这是一个创建于 96 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如一个字符串:“桌子上有苹果、葡萄, 香蕉, 椰子、芒果,桃子,桔子, 西瓜, 荔枝” 上述字符串中,“英文逗号”出现次数最多,怎样将该字符串除空格外最多的标点符号检测出来?

    21 回复  |  直到 2019-07-09 17:36:48 +08:00
        1
    sunny2580839896   96 天前   ♥ 1
    $str = '桌子上有苹果、葡萄, 香蕉, 椰子、芒果,桃子,桔子, 西瓜, 荔枝';
    $arr = explode(',',$str);
    echo count($arr-1);
        2
    kisshere   96 天前
    @sunny2580839896 你理解错了,我的意思是,怎样判断一个文本中哪个标点符号出现的次数最多,而不是指定一个标点符号出现了多少次
        3
    wudanyang   96 天前
    @kisshere 楼上已经说得很明白了
        4
    Canon1014   96 天前
    @sunny2580839896 #1 哇 是个不错的思路,学到了
        5
    Raymon111111   96 天前
    没太懂难点在哪..

    直接遍历, 然后 count?

    唯一有疑问的是, 什么算"标点符号"
        6
    kisshere   96 天前
    @Raymon111111 就是一段文本中,出现了各种中英文标点符号,在完全不知道里面存在哪些标点符号的情况下,怎样统计出现次数最多的标点符号?
        7
    frozenway   96 天前
    ```
    $str = '桌子上有苹果、葡萄, 香蕉, 椰子、芒果,桃子,桔子, 西瓜, 荔枝';
    $tmp = [];
    for($i = 0; $i < mb_strlen($str); $i++){
    $n = mb_substr($str, $i, 1);
    if(trim($n) != ''){
    $tmp[$n] += 1;
    }
    }
    arsort($tmp);
    print_r($tmp);
    ```
        8
    frozenway   96 天前
    ```
    Array
    (
    [子] => 4
    [,] => 4
    [、] => 2
    [果] => 2
    [,] => 2
    [桌] => 1
    [芒] => 1
    [荔] => 1
    [瓜] => 1
    [西] => 1
    [桔] => 1
    [桃] => 1
    [香] => 1
    [椰] => 1
    [蕉] => 1
    [萄] => 1
    [葡] => 1
    [苹] => 1
    [有] => 1
    [上] => 1
    [枝] => 1
    )
    ```
    结果去掉文字就只剩下标点符号了
        9
    5200   96 天前
    可以先 把里面全部空格替换成空。
    然后取第一个标点符号(自己定义一个标点符号数组或者正则取也行),
    接着把匹配到的字符替换成空
    $res = str_replace(find,replace,string,count)
    替换后统计替换次数,

    接着再从里面取一个字符,(循环上面操作)

    如此遍历一遍。直到这个字符串里面没有你所谓的标点符号。
    接着取最大替换次数的 符号。
        10
    icy37785   96 天前 via iPhone
    我也没明白难点在哪里,需要知道哪个标点符号最多,只需要知道各个标点的个数就够了,统计标点个数的方法没有十种也有八种,那么楼主到底是哪个步骤卡住了,于是来发了这么个帖子呢。
        11
    zhangdebo   96 天前
    闲着没事的时候,翻一下 PHP 手册,把每个函数都看一遍,你会发现
    https://www.php.net/manual/en/function.substr-count.php
        12
    Z1076   96 天前
    1 楼的方法不错, 也可以用正则匹配出次数再进行处理
        13
    jowan   96 天前
    $punctuations = ['、', ',', ',', '、', ','];
    $str = '桌子上有苹果、葡萄, 香蕉, 椰子、芒果,桃子,桔子, 西瓜, 荔枝';
    $arr = preg_split('/(?<!^)(?!$)/u', $str);
    $arr = array_count_values($arr);
    arsort($arr);
    echo '<pre>';
    print_r(array_intersect_key($arr, array_fill_keys($punctuations, 0)));

    --------------------------
    实现方式太多了?
        14
    msaionyc   96 天前
    猜测主要难点在于
    1.标点符号集合很大,并不是只有逗号和顿号,中英文符号,数学符号,如果全部列出来,代码会很臃肿,难看
    2.性能,朴素匹配 /split 都可以解决问题,但性能确实较差

    我的观点是:对出现频度较高的符号进行收集并放置在容器里,然后朴素匹配,或者正则挨个匹配,如果性能不行的话我确实没有想到比较好的方案
        15
    sunny2580839896   96 天前
    $str = '桌子上有苹果、葡萄, 香蕉, 椰子、芒果,桃子,桔子, 西瓜, 荔枝';
    $result = str_replace(' ', '', preg_replace('/[\x{4e00}-\x{9fa5}]+/u', '', $str));
    $strRecord = [];
    for ($i = 0; $i < mb_strlen($result, 'UTF-8'); $i++) {
    $found = 0;
    foreach ($strRecord as $k => $v) {
    if ($result[$i] == $v['key']) {
    $strRecord[$k]['count'] += 1;
    $found = 1;
    continue;
    }
    }
    if (!$found) {
    $strRecord[] = ['key' => $result[$i], 'count' => 1];
    }
    }

    我好像没有了
        16
    Tomorrowxxy   96 天前
    张嘴开喷的基本都没审题
    1 楼的方法用来获取指定符号的出现的次数是 ok 的
    楼主的问题我没有想出来好的解决办法,都是很笨的
        17
    crysislinux   96 天前 via Android
    遍历就好了,不要搞什么骚操作。
        18
    azh7138m   96 天前
    @Tomorrowxxy 张嘴开喷的基本是没审题或是没处理过多语言的问题
    什么是标点符号?
        19
    z1154505909   96 天前
    遍历用字符串里面出现的符号切割数组,然后看数组长度,OK
        20
    starsriver   96 天前 via Android
    @frozenway 低效
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4142 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 35ms · UTC 01:31 · PVG 09:31 · LAX 18:31 · JFK 21:31
    ♥ Do have faith in what you're doing.