奇怪的文字编码问题,大家遇到过吗?

2016-09-16 11:47:15 +08:00
 lua

两段看起来一模一样的文字,竟然有着不同的内部编码,有没有什么方法可以将它们相互转换?

스크린샷 2016-09-11 오전

\Uc2a4\Ud06c\Ub9b0\Uc0f7 2016-09-11 \Uc624\Uc804

스크린샷 2016-09-11 오전

\U1109\U1173\U110f\U1173\U1105\U1175\U11ab\U1109\U1163\U11ba 2016-09-11 \U110b\U1169\U110c\U1165\U11ab
1444 次点击
所在节点    问与答
3 条回复
imn1
2016-09-16 12:01:49 +08:00
第一个是 unicode
第二个是键码(拆字),拆字后的 unicode ,懂韩语或其输入法的会知道
如 스(c2a4) 拆成 ᄉ(1109) 和 ᅳ(1173)
imn1
2016-09-16 12:12:18 +08:00
看上去第二个是输入错误引起的
如第一例中 린,韩语常用输入是二或三键构成一个字(空格断字),ᄅ 1105 ,ᅵ 1175 ,ᆫ 11ab ,刚好就是第二例中的 린
感觉是输入法用错了,韩文有输入法是 2 键输入,但输入的人仍然用了习惯的三键,就变成第二例
lua
2016-09-16 15:05:00 +08:00
@imn1 问题已解决,非常感谢!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/306573

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX