Unicode中各种语言的编码范围是多少?

2013-05-08 16:57:24 +08:00
 kenneth
中文
日文
韩文
阿拉伯文
俄文
法文
德文
...等等

是否是通过Uniocde编码范围来区分属于什么语言?
7643 次点击
所在节点    程序员
9 条回复
davepkxxx
2013-05-08 17:14:01 +08:00
swulling
2013-05-08 17:22:19 +08:00
Google Unicode,第一行,点进去,
Unicode字符平面映射
主条目:Unicode字符平面映射
swulling
2013-05-08 17:24:19 +08:00
xesique
2013-05-08 17:29:37 +08:00
可能会比较困难,尤其对于单个字符。

例如:
汉字在中文、日语、韩文里面共享(CJK)。
类似于[é]这样的字符在很多欧洲国家使用。
就算最简单的 A-Z 也在很多国家的语言中有。

参考: http://jrgraphix.net/research/unicode_blocks.php
kenneth
2013-05-08 17:32:58 +08:00
@davepkxxx
@swulling
@swulling
@xesique

想问一下,世界上有多少种语言?
我分析Unicode的目的是想区分世界各种语言。
xesique
2013-05-08 17:39:02 +08:00
参考: http://en.wikipedia.org/wiki/List_of_languages_by_name

至于区分语言,刚刚也说了,我认为仅仅通过 Unicode 区分语言是不现实的。
glasslion
2013-05-08 17:40:49 +08:00
大体上可以的,但日韩字符中有很多来源于汉字的的字符,它们的unicode码是一样的。瑞典文和德文也有类似的情况
luikore
2013-05-08 17:48:05 +08:00
语言和文字不是一回事, 文字和字符不是一回事, 多种文字可能会用到同一个字符的

猜编码+语言可以用 icu
efi
2013-05-10 15:20:36 +08:00
http://www.unicode.org/reports/tr24/ [Data24] Scripts.txt -> http://www.unicode.org/Public/UNIDATA/Scripts.txt

2E80..2E99 ; Han # So [26] CJK RADICAL REPEAT..CJK RADICAL RAP
...
2F800..2FA1D ; Han # Lo [542] CJK COMPATIBILITY IDEOGRAPH-2F800..CJK COMPATIBILITY IDEOGRAPH-2FA1D

# Total code points: 75963

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/68176

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX