请教各位老哥,有没有讲字符编码与字符集的书籍推荐?

2023-09-27 14:38:48 +08:00
 liuguangxuan

有关字符编码和字符集的概念,一直是云里雾里的,虽然知道一些 Ascii 、Unicode 、UTF-8 、GBK 、单字节、多字节、宽字符、char 、wchar_t 、string 、wstring 等知识,但是并不能完全将他们串起来,特别是涉及到他们之间进行转换的时候,一旦在项目中,碰到乱码的问题,就觉得无从下手。

请各位有经验的老哥推荐一些这方面的书籍。如果书中有 C/C++示例就更棒了。

2542 次点击
所在节点    程序员
36 条回复
SmiteChow
2023-09-28 10:37:13 +08:00
其实就是两个概念,理解了就没什么了。
hxysnail
2023-09-28 11:05:01 +08:00
我之前写过一篇博客,可以参考一下: https://fasionchan.com/posts/coding/
koebehshian
2023-09-28 11:05:07 +08:00
维基百科看看就行了,配合 hexdump 一下
Feedmo
2023-09-28 12:26:30 +08:00
unicode explained
karott7
2023-09-28 13:30:35 +08:00
直接维基百科看
yelog
2023-09-28 13:46:22 +08:00
weeei
2023-09-30 17:14:47 +08:00
如果是 Windows 使用 VS 开发,需要注意,源文件使用的编码是跟随当前操作系统的,比如你用简体中文版本,源文件里面的字符串字面量就是 GB1080 ,如果用了繁体字面量在台湾版本的 Windows 下显示是不正常的,这里的原因就需要继续了解文字编码和语言字体的关系了。
weeei
2023-09-30 17:17:19 +08:00
另外 UTF-8 、UTF-16 和 UTF-32 不是 32 > 16 > 8 的关系,UTF-16 是个有缺陷的编码方式,不能表示全部字符集。只有 UTF-8 和 UTF-32 可以。只要记住结论 UTF-8 最牛逼就行了。
liuguangxuan
2023-10-06 15:05:29 +08:00
@Feedmo #24 请问一下老哥,《 Unicode Explained 》这本书有中文版吗?
liuguangxuan
2023-10-06 15:23:58 +08:00
@dandycheung #16 感谢老哥,这篇博文主要讲述的是字节,我想了解的是编码。不过还是谢谢~
liuguangxuan
2023-10-06 15:44:21 +08:00
@xmuli #15 老哥,你给推荐的博文特别棒,正是我所需要的,非常感谢老哥。
还有此类高质量的博文吗?麻烦再给推荐一些吧,如果有此方面的书籍,就更棒啦~
liuguangxuan
2023-10-06 16:03:42 +08:00
@iX8NEGGn #14 老哥写了之后麻烦通知一下啊,等着拜读您的著作。
另外可否推荐几篇您读过的一些高质量的博文?如果有这方面的书籍就更棒啦~
liuguangxuan
2023-10-06 21:12:31 +08:00
@Noicdi #3 感谢老哥推荐的好文章,都一一看完了。老哥还有推荐的类似的高质量文章吗?书籍也可以哈。
xmuli
2023-10-06 22:25:59 +08:00
@liuguangxuan https://github.com/XMuli/QtExamples 乱码和编码部分属于第六章; 部分写的比较早期,希望可以帮助到你
Noicdi
2023-10-07 05:44:18 +08:00
@liuguangxuan #33 我当时也是工作上碰到了字符编码相关的问题,找到了这两篇文章大概看了一下,手上也没有类似的文章了。但是感觉可以在楼主的评论区里学到好多啊哈哈哈。感谢楼主的问题和各位老哥的回复。
Feedmo
2023-10-07 10:47:57 +08:00
@liuguangxuan 中文版我没找着,技术书的英文大多都没那么难读懂的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/977583

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX