有没有类似 word2vec 的分析方法用于简体中文与繁体中文中相同术语的转换,例如 人工智能 <-> 人工智慧,数据科学 <-> 資料科學,可以说是更进阶的 OpenCC

2017-11-20 22:58:26 +08:00
 WildCat
OpenCC ( https://github.com/BYVoid/OpenCC ) 是一个可以实现简繁转换的优秀项目,但是有时候简繁转换还不够,一个用词上还是有差异的。
有没有在用词上可以实现转换的项目呢?
1145 次点击
所在节点    问与答
2 条回复
ynyounuo
2017-11-20 23:09:35 +08:00
本来想说试试 http://cloudtranslation.org/
结果这玩意儿现在连注册都无法注册 - -

还是算了吧。

实际上利用 Crowdsourcing 不是很难做出向你描述的这样的翻译对应。
不过具体应用中可能存在更多的问题。
Arnie97
2017-11-21 01:38:34 +08:00
维基百科: http://zh.wikipedia.org/wiki/WP:CONV

以你举的这个例子为例,需要引入公共转换组: https://zh.wikipedia.org/wiki/Module:CGroup/IT

这个只是简单的查找替换,没有用到 NLP 的技术,但你不妨以此作为改进的基础

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/408072

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX