[网络相关] 求助分析一个早上遇到的服务器服务响应缓慢, hang 住的问题

181 天前
 Curiosity777

环境

              total        used        free      shared  buff/cache   available
Mem:          124Gi        51Gi        59Gi       381Mi        12Gi        71Gi
Swap:         7.9Gi          0B       7.9Gi

top - 11:31:32 up  1:11,  1 user,  load average: 12.09, 10.88, 10.11
Tasks: 1422 total,   3 running, 1417 sleeping,   0 stopped,   2 zombie
%Cpu(s):  8.6 us,  4.0 sy,  0.0 ni, 86.4 id,  0.1 wa,  0.8 hi,  0.2 si,  0.0 st
MiB Mem : 127595.7 total,  60302.0 free,  53900.8 used,  13392.9 buff/cache
MiB Swap:   8044.0 total,   8044.0 free,      0.0 used.  72635.6 avail Mem 

目前整个故障过程中,对 free 命令以及 cpu 负载进行了监控,基本上没有变化,很稳定

现象

今早所有在服务器上部署的服务,均响应缓慢,

我做的处理

1441 次点击
所在节点    Java
9 条回复
lrh3321
181 天前
1. 实体机超卖了
2. 在执行什么占用 CPU 的任务刚好把分给你核心给占用了
3. 实体机对应的 IO 线程拿不到 CPU 时间片。或者 IOPS 过大,你虚拟机被 IO 卡住了
SKYNE
181 天前
swap 分区可以考虑永久禁用掉
Curiosity777
181 天前
@SKYNE 应该和 swap 没关系
Curiosity777
181 天前
@lrh3321 目前那边反馈实体机上只有我们这一个虚拟机,没有其他人占用,不过 io 这块我确实没排查
mgcnrx11
181 天前
可能是虚拟化的软件 bug 。果然是重启大法好
Curiosity777
181 天前
@mgcnrx11 这个确实有可能
SKYNE
181 天前
额,是和 swap 没关系
SKYNE
181 天前
OP 那没有监控系统吗
Curiosity777
180 天前
@SKYNE #8 有的,但是看各项指标都正常

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1118393

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX