mysql 数据库与表的字符集设置问题

57 天前
 labilixin
今天团队里有一个人纠结字符集设置问题。说排序规则不要使用 utf8mb4_0900_ai_ci 。

后来了解他说是要和数据库的字符集与排序规则一致。数据采用的排序规则是 utf8mb4_bin 。

msyql8.0 默认就是 utf8mb4_0900_ai_ci 。所以会出现不一致的问题。

引起了我的好奇。我上网查询字符集设置的一些内容。说是字符集不一致会影响排序结果、索引、和 join 查询等。

但是帖子说的大多都是两张表不一致会影响 join 查询。可是我自己测试的时候却没有影响。

最后虽然我没有测试出来效果,但是感觉还是保持一致比较合理。这里想问一下大家。

1 、数据库的字符集和排序规则和表的字符集排序规则有没有关系。有没有互相影响?
2 、还是说只有表和表之间的字符集不一致才会有影响?
1055 次点击
所在节点    MySQL
7 条回复
Geekerstar
57 天前
有影响,生产上遇到过
dssxzuxc
57 天前
A 表 B 字段 joinC 表 D 字段,select * from A 两个字段的排序规则需要一致,所以最好统一全部数据库字段的排序规则,有特殊需求的字段再另外调整,同时注意这个字段和其它字段 join 时会不会出问题。
另外可以配置成不同的排序规则也允许 join ,但是一般不建议这么做,或者查询时指定成相同的排序规则,但是本来就屎山的长 sql 会更加恶心
vaynecv
56 天前
遇到过一个场景,两张表数据量不大的情况下,联表查非常慢,最终定位下来的原因就是两个关联字段的字符集设置不同😅
LiaoMatt
56 天前
字符集和排序规则有四个维度, 服务器, 数据库, 表, 列;字符集主要是影响存储在磁盘的数据是怎么样的, 排序规则则决定了 B+树如何排序, 如果排序规则不一样, 会影响查询的效率, 比如我用 A 排序, 在一页内连续的数据在另一个索引上使用了排序 B, 导致数据是分散的, 数据的读取从顺序 IO 变成了随机 IO, 效率会低很多
yrzs
56 天前
前几天刚遇到 utf8mb4_0900_ai_ci 不会区分字符大小写,utf8mb4_bin 会区分
NeedI09in
56 天前
不同字符集在联表查询时会进行隐式转换。包括 int 和 str
cnoder
56 天前
字符集和排序有两个关键词 chatset 和 collect ,一般人只关心 chatset ,你再了解下 collect 就懂了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1023866

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX