V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WildCat
V2EX  ›  问与答

有没有类似 word2vec 的分析方法用于简体中文与繁体中文中相同术语的转换,例如 人工智能 <-> 人工智慧,数据科学 <-> 資料科學,可以说是更进阶的 OpenCC

  •  
  •   WildCat · 2017-11-20 22:58:26 +08:00 · 1141 次点击
    这是一个创建于 2320 天前的主题,其中的信息可能已经有所发展或是发生改变。
    OpenCC ( https://github.com/BYVoid/OpenCC ) 是一个可以实现简繁转换的优秀项目,但是有时候简繁转换还不够,一个用词上还是有差异的。
    有没有在用词上可以实现转换的项目呢?
    2 条回复    2017-11-21 01:38:34 +08:00
    ynyounuo
        1
    ynyounuo  
       2017-11-20 23:09:35 +08:00   ❤️ 1
    本来想说试试 http://cloudtranslation.org/
    结果这玩意儿现在连注册都无法注册 - -

    还是算了吧。

    实际上利用 Crowdsourcing 不是很难做出向你描述的这样的翻译对应。
    不过具体应用中可能存在更多的问题。
    Arnie97
        2
    Arnie97  
       2017-11-21 01:38:34 +08:00 via Android   ❤️ 1
    维基百科: http://zh.wikipedia.org/wiki/WP:CONV

    以你举的这个例子为例,需要引入公共转换组: https://zh.wikipedia.org/wiki/Module:CGroup/IT

    这个只是简单的查找替换,没有用到 NLP 的技术,但你不妨以此作为改进的基础
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5837 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 06:18 · PVG 14:18 · LAX 23:18 · JFK 02:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.