有哪些无效的 utf8 编码字节顺序的字符串?在 Java 里怎么用字符串常量表示?

2020-07-24 08:56:05 +08:00
 tctc4869

存带有 0x00 的数据到 postgresql 数据库会出现“无效的 utf8 编码字节顺序”的异常。

在 java 里,0x00 用字符串常量表示为 \000,不过除了 0x00,还有哪些?在 java 里怎么表示?

1911 次点击
所在节点    Java
3 条回复
icyalala
2020-07-24 09:42:12 +08:00
0x00 是有效的 Unicode: https://unicode-table.com/en/0000/ 只是 postgre 不支持罢了。
utf8 编码的规则可以看这里: https://en.wikipedia.org/wiki/UTF-8#Description
rockyou12
2020-07-24 10:17:16 +08:00
0x00 在非常多的系统里都不支持,不要以为 java 支持或者是有效 unicode 就去用。我也对接过 iot 硬件,出了 0x00 其实基本都至少不会异常,最多就是后面的几个控制字符(比如 0x01,0x02 这些),有些显示会出问题。其实 ls 发的 utf8 的表就行了,只要不是人肉拼二进制码基本很难遇到。

0x00 经常遇到只是因为用 c 写的代码初始化字符的时候要忘记赋值,要不就是序列化它只能用 0x00 来表示 null 字符串
ruyu
2020-07-24 23:13:27 +08:00
postgresql 确实不支持 '\0' . 不过话说 C 语言里 '\0' 表示字符串结尾吧, 这个还是有点问题的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/692696

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX