花了好长时间,重新设计了 SDB 的存储模型

2022-09-13 00:03:03 +08:00
 Aidenboss

SDB 背后的思考 ———— List 数据模型设计


我们借助 LSM / B+ 树的实现,已经有了可靠的 kv 存储引擎了 。回顾下我们具备的能力,是一个巨大的、持久化的 sortedMap 。提供的接口是:

那么,我们如何根据上述接口,实现 List 数据结构呢?我们希望 List 数据结构提供以下能力:

存储模型图

List meta 设计

为了应对上述的操作,每个 list 对应 N 个 meta 。其中 meta 包含:

  • version (版本号)
  • count (元素个数)
  • nextSeq (下一个元素的 seq)
  • deleted (是否删除)
  • ttl (过期时间)

meta 在 sortedMap 的 key 称为 metaKey ,其生成规则 = lm:{key}:{version}。其中 version 是通过雪花算法实现全局自增的。假设有一个 listA ,则它的 meta 在 sortedMap 的数据可能是:

list version metaKey meta 信息
listA 0 lm:listA:0 {version=0, count=10, nextSeq=11, deleted=true, ttl=0}
listA 1 lm:listA:1 {version=1, count=3, nextSeq=4, deleted=true, ttl=0}
listA 2 lm:listA:2 {version=2, count=15, nextSeq=16, deleted=false, ttl=0}

可以看出,每个 list 的 meta 是包含多版本的。SDB 只会认为最高版本的 meta 是有效的,非最高版本的 meta 和对应的元素会在后台任务中回收数据。

List 元素在 sortedMap 中的存储结构

List 中每个元素都包含了 seqKey 和 valueKey 。生成规则是:

  • seqKey = ls:{key}:{version}:{seq}:{value}
  • valueKey = lv:{key}:{version}:{value}:{seq}

假设有一个 listA ,它的最高版本是 3 ,其元素列表如:[a, b, c]。 则每个元素在 sortedMap 中存储的数据如:

元素 seqKey valueKey
a ls:listA:3:0:a lv:listA:3:a:0
b ls:listA:3:1:b lv:listA:3:b:1
c ls:listA:3:2:c lv:listA:3:c:2

由于 sortedMap 是有序的,在遍历 list 时,我们可以通过 seqKey 进行遍历。这样我们可以顺序得到元素 a 、b 、c 。

为了实现快速删除 list 中的某个元素,我们可以借助 valueKey 实现快速删除元素。

List ttl 设计

为了支持 List 过期功能。SDB 在 List meta 中增加了 ttl 字段。 假设 listA 在版本 3 中设置了 ttl=10 ,则在 sortedMap 中 listA 的 meta 数据可能是:

list version metaKey meta 信息
listA 0 lm:listA:0 {version=0, count=10, nextSeq=11, deleted=true, ttl=0}
listA 1 lm:listA:1 {version=1, count=3, nextSeq=4, deleted=true, ttl=0}
listA 2 lm:listA:2 {version=2, count=15, nextSeq=16, deleted=false, ttl=0}
listA 3 lm:listA:3 {version=3, count=8, nextSeq=9, deleted=false, ttl=10}

当读取 listA meta 时,会读到最后一行,发现 ttl < 当前时间,则认为该 listA 数据是不存在的。

List 回收 deleted 数据

由于 SDB 采用的是标记删除。假设有一个 listA ,其操作流程如下:

  • 向 listA 增加元素 a
  • 删除整个 listA
  • 向 listA 增加元素 b
  • 删除整个 listA
  • 向 listA 增加元素 c

则 listA 的 meta 在 sortedMap 存储的数据如:

list version metaKey meta 信息
listA 0 lm:listA:0 {version=0, count=1, nextSeq=1, deleted=true, ttl=0}
listA 1 lm:listA:1 {version=1, count=1, nextSeq=1, deleted=true, ttl=0}
listA 2 lm:listA:2 {version=2, count=1, nextSeq=1, deleted=false, ttl=0}

元素在 sortedMap 存储的数据如:

list version 元素 seqKey valueKey
listA 0 a ls:listA:0:0:a lv:listA:0:a:0
listA 1 b ls:listA:1:0:b lv:listA:1:b:0
listA 2 c ls:listA:2:0:c lv:listA:2:c:0

会发现 listA 记录中 version=0 和 version=1 相关数据都可以回收。

为了支持快速回收无效数据,SDB 为 deleted 的 list 版本增加了 deletedKey ,如 listA 的 deletedKey 在 sortedMap 的数据是:

list version deletedKey
listA 0 ld:listA:0
listA 1 ld:listA:1

SDB 会定时扫描 deletedKey 并回收相关数据。

List 回收 ttl 数据

和 SDB 实现的标记删除一样,SDB 也会存在大量过期的数据,假设对 listA 的操作流程如下:

  • 向 listA 增加元素 a
  • 设置 listA ttl=1 (会快速过期)
  • 向 listA 增加元素 b
  • 设置 listA ttl=1 (会快速过期)
  • 向 listA 增加元素 c

则 listA 的 meta 在 sortedMap 存储的数据如:

list version metaKey meta 信息
listA 0 lm:listA:0 {version=0, count=1, nextSeq=1, deleted=false, ttl=1}
listA 1 lm:listA:1 {version=1, count=1, nextSeq=1, deleted=false, ttl=1}
listA 2 lm:listA:2 {version=2, count=1, nextSeq=1, deleted=false, ttl=0}

元素在 sortedMap 存储的数据如:

list version 元素 seqKey valueKey
listA 0 a ls:listA:0:0:a lv:listA:0:a:0
listA 1 b ls:listA:1:0:b lv:listA:1:b:0
listA 2 c ls:listA:2:0:c lv:listA:2:c:0

会发现 listA 记录中 version=0 和 version=1 相关数据都可以回收。

为了支持快速回收无效数据,SDB 为 ttl 的 list 版本增加了 ttlKey ,如 listA 的 ttlKey 在 sortedMap 的数据是:

list version ttlKey
listA 0 lt:listA:0
listA 1 lt:listA:1

SDB 会定时扫描 ttlKey 并回收相关数据

List 增加元素

假设 listA 最高版本号是 0 ,有元素 [a, b, c]。则其元素在 sortedMap 存储的数据是:

list version 元素 seqKey valueKey
listA 0 a ls:listA:0:0:a lv:listA:0:a:0
listA 0 b ls:listA:0:1:b lv:listA:0:b:1
listA 0 c ls:listA:0:2:c lv:listA:0:c:2

可以看出,seqKey 是用来控制遍历 list 顺序的。假设向 listA 左边增加元素 d ,右边增加元素 e ,则数据如下:

list version 元素 seqKey valueKey
listA 0 d ls:listA:0:-3:d lv:listA:0:d:-3
listA 0 a ls:listA:0:0:a lv:listA:0:a:0
listA 0 b ls:listA:0:1:b lv:listA:0:b:1
listA 0 c ls:listA:0:2:c lv:listA:0:c:2
listA 0 e ls:listA:0:4:e lv:listA:0:e:4

可以看出 SDB 通过在元素上使用负的 seq ,达到了左边和右边增加元素的功能。

1044 次点击
所在节点    Go 编程语言
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/879553

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX