PVE 运行缓慢如何排查?

133 天前
 V392920

自己用 N5105 配 nvme 硬盘搭建的 pve ,用了 2 年了吧

突然在前天断电了一次,就启动不了了,接上显示器查看卡在了

/dev/mapper/pve-root: clean, 213944/7012352 files, 16716818/20049408 blocks 一直进不去

在网上搜索相关资料,基本都是说重装/硬盘损坏等,有 1-2 个说改配置文件之类的,照着改了也没生效,一样卡住

然后自己进恢复模式也不行,也是一堆的报错,一直卡住,我就一直手动重启重启,也不知道重启了多少次,折腾了 3 个小时,突然进系统了

但是特别的卡,web 页面很久都加载不出来,哪怕 ssh 输入了都很久没反应,从 ip 能 ping 通到 ssh 能连上,起码有 20 分钟

我总共就装了 2 个 lxc ,1 个 vm

等能正常进 ssh 和 web 了,我在 web 看了下 io ,基本几秒钟就能跑 80%以上,甚至 95%以上,直接卡红,但是通过 iotop 等命令查看,并没有很高的磁盘读写进程,然后又用命令看了下硬盘健康度,也都是正常范围内,没有问题,磁盘剩余空间也大于 60%

现在就不知道怎么搞了,也不敢再重启或者断电,怕又起不来,现在在 web 端备份一下虚拟机(备份完成文件 8g 左右),备份了一下午才备份完成,以前都是 4-5 分钟就好了

来问问各位大佬,这种该如何排查,请指教,谢谢。

1448 次点击
所在节点    程序员
7 条回复
V392920
133 天前
没有老哥指点吗?
yc8332
133 天前
应该是硬盘有问题了。可能你的盘坏了
Alliot
133 天前
iowait 很可能是主要问题 看看硬盘
V392920
133 天前
@yc8332 我通过命令和 web 看 smart 值,都是正常的,还有啥方法确认是硬盘问题吗?
V392920
133 天前
@Alliot SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 55 Celsius
Available Spare: 91%
Available Spare Threshold: 10%
Percentage Used: 6%
Data Units Read: 113,625,498 [58.1 TB]
Data Units Written: 62,643,145 [32.0 TB]
Host Read Commands: 1,455,671,213
Host Write Commands: 1,812,177,678
Controller Busy Time: 191,896
Power Cycles: 160
Power On Hours: 20,235
Unsafe Shutdowns: 146
Media and Data Integrity Errors: 0
Error Information Log Entries: 0
Warning Comp. Temperature Time: 68
Critical Comp. Temperature Time: 14

这是硬盘信息,应该没啥问题哇
GobyHsu
133 天前
趁着还能访问,别折腾了,直接备份 -> 更换,就得了。N5105 这种小主机更换成本也相对不高,也算正好有理由换个 N150 ,N355 的升级下
hysjw
133 天前
而且你放小主机本来应该也不是啥重要数据 重来就行了 重要的还是推荐 NAS+云端双保险

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128624

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX