C 语言怎么输出 Unicode 对应的汉字?

2018-08-31 09:00:32 +08:00
 lonisletend

比如说我得到一个类似“\u6d4b\u8bd5 ”的字符串,怎么让它在屏幕上以汉字形式输出,查到的都是 Windows 平台的处理方法,有没有通用的库或者方法?

4907 次点击
所在节点    C
7 条回复
shilyx
2018-08-31 09:21:29 +08:00
这个问题不是 C 语言处理的范畴。

类似的问题还有“如何弹出一个消息提示?”

C 语言中没有这些标准库,C++也没有,这些都是运行 C 语言编写程序的操作系统提供的接口,API
CEBBCAT
2018-08-31 09:23:20 +08:00
putchar,每次推一个字节,推俩字节就好了

\u6d4b:putchar(0x6d) putchar(0x4b)
chingyat
2018-08-31 09:42:03 +08:00
```
int main() {
printf("\u6d4b\u8bd5");
}
```

直接输出就可以啊
yksoft1
2018-08-31 10:11:25 +08:00
Windows 下原生 Unicode 是 UCS-2,Linux 下原生 Unicode 是 UTF-8。
sprintf 等不带前缀的 stdio 函数,Windows 下是 ANSI 内码,Linux 下默认是 UTF-8。
因此通用的方法并不存在。
iwtbauh
2018-08-31 10:14:04 +08:00
终端可能只能显示某种字符编码的 Unicode 字符

一般得,shell 通过 LC_MESSAGES LANG 等环境变量告知应用程序终端使用什么编码,在大多数中文环境下( GNU/Linux,OS X,FreeBSD...)环境变量值为 zh_CN.UTF-8,意思是中文,终端使用 UTF-8 编码,因此你必须输出 UTF-8 编码才可以被人类识别。因此你需要读取环境变量,发现编码然后进行字符串转码,更好的方法是默认使用 UTF-8,这样就不用转码了(但是出去这个环境就用不了了)。

另外,通过 gettext 等库实现将字符串剥离到数据文件,由翻译者提供各种编码的本地化文件才是主流做法,开发者不应该在代码逻辑里操心这些细枝末节的东西。
purgle
2018-08-31 11:50:10 +08:00
Windows 下中文的编码 C/C++方式是 GB2312,查查 unicode 转 GB2312 的方法
FrankHB
2018-09-16 07:01:36 +08:00
@yksoft1 Win2k 以后 NT 原生支持就基本上从 UCS-2LE 改成 UTF-16LE 了。Win32 倒是有 WM_UNICHAR 之类的坑货在之后才完善支持。

@purgle CP936 明显不是 GB2312。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/484771

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX