有几个关于 etcd 部署的问题想问问大家

2021-06-11 10:44:01 +08:00
 zhoudaiyu

最近发现 master 节点上的组件运行都不正常,最后查到了是磁盘 I/O 性能不行导致 etcd 落盘变慢从而影响了其他组件的运行。我们的 etcd 是运行在虚机机上的,可能有其他的机器 I/O 高影响了 etcd 的机器。

有三个问题问问大家:

1 、你们的 etcd 是运行在和其他 master 节点组件一起部署的吗?

2 、etcd 是运行在虚机上还是物理机?如果是虚机的话会避免和其他虚机部署在同一个物理机吗?

3 、etcd 的数据目录是单独挂盘吗?是机械硬盘还是 SSD 呢?因为我看了 etcd 官网是推荐 etcd 部署在 SSD 上的?

1770 次点击
所在节点    Kubernetes
7 条回复
suifengdang666
2021-06-11 11:02:34 +08:00
其实很简单,看(资源)钱办事,你的项目有多重要,能拿到多少资源,决定了服务器性能的上限。如果上限已经明确,那就只能从软件层面尽力去优化了。
zhoudaiyu
2021-06-11 11:15:26 +08:00
@suifengdang666 硬件资源在协调,软件上用了 etcd 官方推荐的 ionice 调整 etcd 的 io 优先级,从结果来看不是很明显
huweic
2021-06-11 11:26:36 +08:00
普通虚机,具体隔离性也看做的好不好吧,Master 节点会申请比较高一档的配置,ETCD 直接放在 Master 节点上,单独挂 SSD 给 ETCD 用,然后会禁止调度不跑普通任务
asilin
2021-06-11 11:35:17 +08:00
如果对可用性要求不高,可以调大"--snapshot-count" 参数的值,让数据尽量不落盘,减少磁盘 IO 。

该值默认为 100000,kubernetes 为了安全起见,减小到了 10000,你可以设置为 100000 以上观察下效果。
zhoudaiyu
2021-06-11 12:37:17 +08:00
@asilin 目前没有 SSD 资源了,虚机已经迁移到磁盘 IO 压力小的机器上了,但是还是不好使。您说的这个参数我试试,谢谢啦
zhoudaiyu
2021-06-11 12:38:09 +08:00
@huweic 目前没有 SSD 了 QAQ,虚拟化用的 VMWARE 的我也不清楚具体咋做的
zvcs
2021-06-11 21:41:54 +08:00
@zhoudaiyu 能上 ssd 更好。esxi 的磁盘 io 性能一直很尴尬

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/782834

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX