大量简体-->繁体转换方案

2012-01-13 16:41:15 +08:00
 just44
有大量的文本需要从简体转换到繁体, 是文本...比如“简体”到“簡體”这种的, 不是编码,请问有什么快速的方案吗?最好是Mac OS X, Linux上的
4246 次点击
所在节点    问与答
17 条回复
kenzi
2012-01-13 16:45:32 +08:00
Mac OS X 自带的吧, 选中字, 右键 Services -> Convert Selected Simplified Chinese Text
cloverstd
2012-01-13 16:46:01 +08:00
Google Translate不行么?
hewigovens
2012-01-13 16:51:35 +08:00
just44
2012-01-13 16:53:49 +08:00
@cloverstd Google翻译会破坏缩进格式..里面是参杂着代码的..

@kenzi 谢谢..有更快一点方法吗? 文件n多...
just44
2012-01-13 16:54:33 +08:00
@hewigovens 看起来似乎不错!我试试
loading
2012-01-13 16:59:40 +08:00
看标题我想到的就是ms word....
phus
2012-01-13 17:04:58 +08:00
@loading 从office 2007中提取出来的简繁库 https://github.com/phus/tcscconv
hewigovens
2012-01-13 17:15:02 +08:00
@phus 最好是写几个sample,才好推广,比如输入个文件,输出下
reducm
2012-01-13 17:23:28 +08:00
用简繁库做的话很简单啊
ywjno
2012-01-13 17:33:00 +08:00
简转繁就是一个对应表的关系,
不过你有没有考虑,同一个东西,简体跟繁体用的词不一样的问题了么?
比如:硬盘---->硬碟

而且,港澳繁体跟台湾正体在某些字某些词上也有不同
reducm
2012-01-13 17:40:05 +08:00
@ywjno 哈哈,这样再来个语意hash
fanzeyi
2012-01-13 17:41:44 +08:00
推荐 OpenCC .. 跨平台的
fanzeyi
2012-01-13 17:42:08 +08:00
ywjno
2012-01-13 18:03:32 +08:00
@reducm 语意都搞不定的,比如“贝克汉姆”在香港就叫做“碧咸”
fanzeyi
2012-01-13 18:24:35 +08:00
对了 举个例子:

下面 -> (下面, 下麵)

这种有很多
cynial
2012-01-13 18:27:27 +08:00
@just44 @ywjno ms word 的转换效果已经很不错了。 像 硬盘->硬碟 这种转换已经实现,而“贝克汉姆”这种直翻的,可以通过word里面的自定义词典完成。
clino
2012-01-13 21:41:33 +08:00
@ywjno 这种程度的语义是可以搞定的
https://code.google.com/p/advanced-langconv/
楼主用这个吧,这个可是能用在 zh.wikipedia.org 上的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/25545

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX