V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
lusin
V2EX  ›  PHP

请问如何判断一个字符串是否多拼,如果是多拼如何判断由几个拼音组成呢?

  •  
  •   lusin · Mar 20, 2014 · 4897 views
    This topic created in 4424 days ago, the information mentioned may be changed or developed.
    7 replies    1970-01-01 08:00:00 +08:00
    Fedor
        1
    Fedor  
       Mar 20, 2014
    你自己怎么判断的? 把自己的判断思维转换成程序语言。
    jsonline
        2
    jsonline  
       Mar 20, 2014
    什么叫多拼? 什么样的字符串?
    lusin
        3
    lusin  
    OP
       Mar 20, 2014
    @jsonline 就是一个字符串可以拆成单字拼音 比如 dapaiyundongxie 能拆成 da pai yun dong xie这样
    @Fedor 自己想不到好办法,双拼的话就把单字拼音拼成双拼存起来,判断的时候去比较,但多拼就想不到好办法了,超过四五拼了感觉数据有点大,单字拼音差不多400个左右,按我说的拼起来的话五拼就有点吓人了
    qiayue
        4
    qiayue  
    PRO
       Mar 20, 2014
    其实跟中文分词是一个思路,你可以去研究一下分词算法
    xianshi 西安市/县市
    lerry
        5
    lerry  
       Mar 21, 2014 via Android
    我觉得应该从拼音的结构入手,一般的词是声母加韵母,有的词只有韵母
    iEverX
        6
    iEverX  
       Mar 21, 2014
    拼音,声母,b p m f d t n l 等,韵母 a o e i u v ai ei ui等,还有类似于 xuan这种,可以学一下双拼的方法,声部就是声母了,韵部包括韵母和韵母组合 uan,ian这种。然后用这三种串区匹配一个输入的字符串,知道完成或者不能匹配为止
    只有 声部 + 韵部,或者韵母(不包括uan这种)才是拼音
    dong3580
        7
    dong3580  
       Mar 22, 2014 via Android
    C#里面有个拼音转成汉字汉字转拼音,识别率还是很高的,可以尝试调用,试试。至于其他语言,我想应该也有类似的吧,尝试用学习的方法,将用户输入频率高的加入字典,这样可以间接给出用户拼写建议。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2684 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 37ms · UTC 14:37 · PVG 22:37 · LAX 07:37 · JFK 10:37
    ♥ Do have faith in what you're doing.