Spring Cloud 微服务架构,体量中等,最近老出现 http 连接拒绝,如何排查问题?

2020-09-24 16:29:23 +08:00
 Variazioni

目前大概十几个微服务部署在一台 Linux ( suse 、centos 都有)机器上
其他的还有 nginx 、mysql 、rabbitmq 、elasticsearch 、influxdb 等服务
to b 的业务,从 web 访问的并发量并不大,但是服务间 http 调用比较多,每分钟都有定时任务运行,还有每分钟采集设备数据到 influxdb 的相关逻辑
最近老发现中间使用 netty http 调用的老出连接被拒绝的异常
feign 调用偶有超时
rabbitmq 也偶尔报 AmqpTimeoutException

想咨询一下大佬们如何排查问题?
linux 用户最大文件数量已经调到 100w 了
不知道是 linux 的限制,还是 jvm 内存没分够?

使用 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}'命令查看并发的 tcp 数量并不多,ESTABLISHED 在 300 左右徘徊,是方法不对还是本身就不是网络调用的问题?

961 次点击
所在节点    问与答
2 条回复
isir1234
2020-09-24 17:42:10 +08:00
可以先查看每个进程打开的文件数:
ps -opid= -ax | xargs -L 1 -I{} -- sudo bash -c 'echo -n "{} ";sudo lsof -p {} 2>/dev/null | wc -l' | sort -nr -k2
isir1234
2020-09-24 17:48:55 +08:00
Spring Cloud Hoxton.SR5 版本的 Gateway 确实是有 file descriptor 无限增长的问题的, 可以作为一个排查点.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/710154

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX