golang 面试题之为什么这种更快呢?

2020-06-02 20:34:52 +08:00

xmge

package main

import (
    "fmt"
    "time"
)

func main() {
    size := 20000
    matrix1 := make([][]int, size)
    for i := 0; i < size; i++ {
        matrix1[i] = make([]int, size)
    }

    start1 := time.Now()
    // 方法 1
    for i := 0; i < size; i++ {
        for j := 0; j < size; j++ {
            matrix1[i][j] = i + j
        }
    }

    fmt.Println(time.Since(start1))

    matrix2 := make([][]int, size)
    for i := 0; i < size; i++ {
        matrix2[i] = make([]int, size)
    }

    // 方法 2
    start2 := time.Now()
    for i := 0; i < size; i++ {
        for j := 0; j < size; j++ {
            matrix2[j][i] = i + j
        }
    }
    fmt.Println(time.Since(start2))
}

// 1.1769527s
// 8.5584257s

为啥第一种更快呢？

8291 次点击

所在节点

程序员

63 条回复

reus

2020-06-02 20:59:30 +08:00

cpu 会缓存连续的一部分内存，第一种连续操作一片内存，所以快，而第二种跳来跳去，缓存都不命中

xmge

2020-06-02 21:18:03 +08:00

@reus 这方面的书面解释到哪里去看呢?

Jirajine

2020-06-02 21:26:05 +08:00

https://en.m.wikipedia.org/wiki/Cache_prefetching

frozenshadow

2020-06-02 21:26:24 +08:00

@xmge https://mp.weixin.qq.com/s/viQp36FeMZSqUoFy3VrBNw

jworg

2020-06-02 21:27:53 +08:00

https://www.cnblogs.com/jokerjason/p/10711022.html

qq316107934

2020-06-02 21:35:09 +08:00

@frozenshadow #4 这篇文章太棒了。
不过刚进来第一反应是考虑二维 slice 有一个二次寻址的过程，反复在 slice 间切换会不会在这个过程也有一定的时间浪费？

frozenshadow

2020-06-02 21:42:26 +08:00

@qq316107934 golang 的数组排布方式具体没确认过。如果是 c 的话二维数组在内存其实也是一维的，寻址是用 ptr+(i)*n+j 这样来找的

ManjusakaL

2020-06-02 21:42:56 +08:00

CPU 缓存问题

xmge

2020-06-02 21:50:41 +08:00

@Jirajine @ManjusakaL @frozenshadow @qq316107934 @reus 感谢各位大佬...

xmge

2020-06-02 22:06:34 +08:00

吾生也有涯，而知也无涯，以有涯随无涯，需 v 站也。

CEBBCAT

2020-06-02 22:26:35 +08:00

粗粗看了一下，是空间局部性吗？记得前几天有人讨论排序算法，快排纸面上看起来没简并快，实际却跑赢了好像就是这个原因。CPU 会把邻近的内存区块一并读入缓存

seaswalker

2020-06-02 22:27:10 +08:00

CPU 缓存是按行来的吧，我记得《深入理解计算机系统》里面有详细讲解…

arjen

2020-06-02 22:28:51 +08:00

cache line

FutherAll

2020-06-02 22:36:01 +08:00

c 语言的话，数组是优先行存储，方法一的访问方式是按照存储顺序来访问的，空间局部性好。
可以看 csapp 的存储器层次结构，讲局部性的那部分。

zhs227

2020-06-02 23:01:07 +08:00

我并不觉得这两种方式存在本质的区别，好奇心让我试了一下，发现上面答案提的并不是最主要的因素，是代码写的有问题，只需要把方法 2 中的`matrix2[j][i]`中的 i 和 j 对换一下，能跑到比方法一更快。

没改之前：
go run test.go
2.103482788s
8.669886344s

改之后：
1.69951775s
1.543304649s

尝试把方法 1 中的 i 和 j 位置也换一下:
go run test.go
9.274899793s
1.484341903s

结论：变化快的数字应该做低维下标，如果 i 是外层循环变量，应该把 i 放在前面。

fighterlyt

2020-06-02 23:07:58 +08:00

@zhs227 你这个回答太逗了，内存虽然是 Random 访问，但不代表 Random 没有成本。就像 CPU 的乱序执行以下，分支预测失败之后成本太高了

FutherAll

2020-06-02 23:13:07 +08:00

@zhs227 ij 换位置就和方法一一样了，你不是认真的吧😂

qieqie

2020-06-02 23:17:28 +08:00

可以再加一问：对于现在主流 x86 cpu，size 取多少的时候两者相差最大？

tslling

2020-06-02 23:34:50 +08:00

@qieqie 这要看缓存行一行能装多少个元素，就是缓存行和元素各是多大，如果缓存一行能装 n 个元素的话，在 size 是 n 的倍数时，方法一每 n 次有一次不命中，方法二总是不命中。我觉得这种情况下差距是最大的。

这也不是 golang 问题呀，是体系结构相关的。

aapeli

2020-06-02 23:47:31 +08:00

兄弟们可以尝试给 golang 官方仓库提 issue 问下看有没有大牛解答一下

第 1 页／共 4 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/677996

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

golang 面试题之 为什么这种更快呢?

golang 面试题之为什么这种更快呢?