一个弱值的问题,读的成本比写低多少?

2020-09-21 23:40:28 +08:00
 786375312123

RT 以前上大学学过汇编,可是好久不用记不清楚了。而且那个时候也没讨论过成本问题。

比如说很简单的 c++代码

a > 0 和 a = 12

前一句的成本能比后一句低多少?底在哪了?

2072 次点击
所在节点    程序员
9 条回复
lcdtyph
2020-09-22 00:25:58 +08:00
单独拎出来两句比较对应汇编的性能是没有意义的,还要考虑前后指令对流水线、缓存的影响
ryd994
2020-09-22 01:59:56 +08:00
建议你代码成形前不要纠结这种细枝末节的事
代码成形以后,你会发现你的程序根本没到这个级别
如果你的程序真的需要这个级别的优化,那你应该已经掌握各种 profiling 的用法,问不出这个问题。
786375312123
2020-09-22 02:22:59 +08:00
@ryd994 我工作不少年了。就是今天突然想起这个问题,好奇
786375312123
2020-09-22 02:26:55 +08:00
@lcdtyph 这个只是举例。我也不想比较 mov 和读语句(忘记哪个了,读有对应的汇编么?)我就是想知道语义上的读和写,哪个成本更高?似乎读的话,你一定拷贝一个东西,不管是地址还是值。写的话,似乎需要获取地址,然后写到这个地址?
这么看读的成本大概率比写要低?
cassyfar
2020-09-22 02:30:48 +08:00
今天所说的“写”成本,主要是指互联网应用下分布式系统的“写”,里面涉及了 replica 的更新,多个写到同一 entry 的 consistency,cache 的更新,高 TPS 下如何处理写,atomic 的写,等等吧。而读,基本就是一个读。
vk42
2020-09-22 02:30:49 +08:00
@786375312123 读和写都涉及地址和数据啊,从 CPU 执行单元来看没啥区别。如果按你的假设没有上下文,现在主流 CPU 的 Cache 是写回策略,所以写会直接 Cache hit,而读是直接 miss,所以读更慢
AX5N
2020-09-22 02:54:55 +08:00
`mov eax, [ebp-4]`,把内存里的某个值复制到寄存器上,`mov [ebp-4], 5`,把某个值直接写入地址里,`mov eax, 5`把某个数直接写入寄存器里,`mov [ebp-4], eax`把某个数从寄存器里写入到内存里。这 4 个操作你既可以看成是读,也可以看成是写,不过读似乎都是先复制到寄存器上?

鬼知道谁比较快是比较慢,你可以用 c++写个循环自己去测一下啊。编译之后再用调试器去改下汇编代码就好了。
OysterQAQ
2020-09-22 08:13:46 +08:00
@vk42 cpu 多级缓存策略不同,
CRVV
2020-09-22 11:04:51 +08:00
https://software.intel.com/sites/landingpage/IntrinsicsGuide/#text=vmovdqu&techs=AVX&expand=5655,3418

单纯回答这个问题的话,随便找一对 load 和 store 指令看文档就好了
所以不同的处理器上不一样,Intel 架构上 load store 指令有一大堆,估计这个数字还会各不相同。
上面链接里的这一对指令,在 Icelake 上是 store 的开销比 load 小

当然,以上回答其实没有意义,因为如一楼所说这个数字没有用。

不过,如果你要做的是一个并发的系统,可能是 cpu core 并行工作,也可能是你部署了一个集群来处理请求。
那么, 在很多情况下,最后系统的瓶颈是在对同一个位置的写操作上。
比如 atomic counter,不论是 cpu 上实现的还是 Redis 实现的,这个写操作都不可能被无限扩展,在 cpu core 足够多或者并发请求足够多的时候就会成为瓶颈。

所以,通常情况下,设计架构 /算法时,会让写操作少一些。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/709204

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX