读写分离到底是大招还是人云亦云？真正做过的人有多少？

大部分所谓架构文章都会先介绍分库分表，再扛不住就读写分离对吧。

但没人往下讲细节了。
如果是异步同步，可以保证写主库成功之后返回，但保证不了延迟。比如写完马上读就会有问题。
如果等待同步从库成功后再返回，实际就是双写。那么故障几率就更大了，可用性就会降低。

好吧我知道还有所谓“具体业务具体分析”，但实际上哪有那么多具体业务能忍受可用性降低或者同步延迟。就比如订单，钱不能算错，库存也不能错，但没听说过谁说用可用性来做 trade off 的。

我始终认为，提升系统容量，要有一套能撑得住的运维体系，然后一直分库分表就好了。所谓主从同步，是一个“高可用”方案，在主库挂掉的时候从库顶上。而不是 scale out 方案。

那，真正做过读写分离方案的，到底有多少？

wentaoliang

2019-04-19 10:46:26 +08:00

这个理解就不对了。主从除了高可用，另外一个作用就是负载均衡，你想想如果访问到数据库的 qps 有几 w，你再怎么分库分表，单机都不可能承受的住

jimrok

2019-04-19 10:49:18 +08:00

大部分的查询请求，其实不用那么实时，例如订单完成之后，可以不用变化。而且 mysql 的复制还是非常快的，100 毫秒上下，这样主库就可以把 cpu 剩下来提高写入的 ops。

huadi

2019-04-19 10:50:24 +08:00

@wentaoliang 分库又不是只能在单台机器上分，跑在多台机器上的多个实例也叫分库。
关键是纸上谈兵的文章太多了，深入细节就没人讲。
那么，我原文问的的两个如果怎么破？

zhengyongtao

2019-04-19 10:51:59 +08:00

读写分离是为了负载均衡，单机性能同时做读写撑不了多少 qps，另外一般订单这种都会使用缓存和队列，而不是直接入库，什么都等入库黄花菜都凉了。

wentaoliang

2019-04-19 10:55:28 +08:00

@huadi 比如你是一个库的某个表请求几 w，你就只能读写分离了，对于读写同步延迟的。就不应该在同一个请求中写完立马就读，如果非得这么做，让第二次强制读主库

huadi

2019-04-19 10:59:25 +08:00

@guyujiezi 缓存和两个 db 双写还是不一样的。
缓存很快。
缓存不是持久化方案，可以采用 db+缓存双写而不降低可用性。
缓存和 db 的一致性，仍然是问题。

huadi

2019-04-19 11:05:33 +08:00

@wentaoliang 分库分表最大的问题是数据倾斜和运维水平。比如按 userId 分，可能有某个 user 的请求很多。或者 db 特别多。否则无论如何我都可以降低 QPS。
强制读主库确实是个好方法。但我不知道怎么控制这个时间阈值，因为同步延迟很难保证。网络抖动这个天灾就受不了。

vmskipper

2019-04-19 11:06:00 +08:00

根据自己的 qps tps 而定链接过多或者活动事务过多就弄呗读压力过大就加缓存写压力过大就分片每天 2000 万的记录消息几亿总量百亿现在就这么弄的

guyujiezi

2019-04-19 11:11:58 +08:00

@huadi 主从架构不能叫“双写”，这样说法会有歧义的，两主才叫双写。

主从同步一般都是异步的，这叫最终一致性，同步写入那就变成两阶段提（ 2PC ）交了

whileFalse

2019-04-19 11:22:40 +08:00

“写完马上读就会有问题”

没错。所以要从业务层弥补。
当如果写和读属于两个无关业务，比如用户 A 刚更新了自己的头像，用户 B 立即去拿结果拿到了旧的；这种情况通常是可忍受的。因为如果用户 B 的这个请求早发送 1s，那么他看到的肯定就是旧的；两个业务之前不存在因果关系。

如果写读属于同一个业务，比如更改用户单张借记卡的余额，然后显示用户所有卡的总余额；这种情况要不将两个数据库操作合并为同一个操作，要不从业务层将两个独立的请求合并为一个请求，要不强制读主库；要不告诉用户”更新可能延迟“之类的。

总之，上读写分离是和业务相关的，无法做到对开发透明。在业务理解并做针对性优化的情况下，可用性不会是问题。

huadi

2019-04-19 11:27:08 +08:00

@guyujiezi 我的原始问题是原文的两个如果。
如果不双写，做异步同步，这没问题的。那我的疑问是怎么处理延迟。
主从延迟很低是没错，但关键是这个延迟是无法保证的。也就是说平常 100ms 之内，但网络一抖动，分钟级别的延迟都有可能发生。这个时候从库是没办法提供服务的，怎么处理这种问题呢？

glfpes

2019-04-19 11:40:21 +08:00

你举的例子就是那种“读写分离不太合适”的情况。订单系统这种强一致性的场景不多且一般都是关键场景，花更多的资源有价值。
实际上很多场景，不需要强一致性。当读写不均衡的情况下，比如读的 qps 比写高几个数量级，读写分离还是很常见的做法。比如用户画像。其实用到本地缓存的地方都可以搞读写分离。

lhx2008

2019-04-19 11:46:20 +08:00

分布式系统最大的问题就是很难保证强一致性，对于普通业务，主要通过逻辑弥补。对于敏感的业务，主写从读会出问题。

逻辑弥补有很多方法（来自李运华的文章）
1. 业务可以接受，系统不优化
2. 写操作后的 n 秒内读操作指定发给数据库主服务器
3. 读从机失败后再读一次主机
4. 关键业务只走主机，可接受延迟的业务走从机
5. 走缓存，先更新缓存，缓存过期肯定已经刷入从机了

楼主看的“所谓架构文章”，怕不是 CSDN 上面的？

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/556677

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

读写分离到底是大招还是人云亦云 ？真正做过的人有多少？

读写分离到底是大招还是人云亦云？真正做过的人有多少？