用 nginx tcp 转发,并发高的时候报错怎么解决

2022-02-23 08:49:09 +08:00
 aries910

一个 1 核 1g 的 ECS 连接数到七八百的时候,就开始大量报错 connect() to [fe80::60e9:7eae:2ab5:7f4b%14]:1234 failed (101: Network is unreachable) while connecting to upstream, client: 149.86.33.169, server: 0.0.0.0:5487, upstream: "[fe80::60e9:7eae:2ab5:7f4b%14]:1234", bytes from/to client:0/0, bytes from/to upstream:0/0 看网上说禁用 IPV6 可以,但尝试后无效...

如下这些设置都有,还请大佬给点建议缺少什么配置 worker_connections 8192; worker_rlimit_nofile 65535 tcp_nodelay on;

2765 次点击
所在节点    NGINX
14 条回复
jifengg
2022-02-23 08:59:15 +08:00
是 1m 的带宽么,是不是网络占满了。
Davic1
2022-02-23 09:05:54 +08:00
1. 把 keep alive 打开, 重用 tcp 连接. 比如用 http1.1 协议
2. 在 upstream 上设置 keepalive
3. 把 linux 的临时端口设置大一些 (local_range_port)
4. 把 linux 的文件句柄数设置大一些.
vanton
2022-02-23 09:09:53 +08:00
贴一下你的 nginx 配置。
高并发出问题看着就是连接数满了。
aries910
2022-02-23 10:22:56 +08:00
@vanton worker_processes 1;

events {
worker_connections 8192;
}

worker_rlimit_nofile 65535;

stream {
open_log_file_cache off;

upstream aaa {
server aaa.com:1234 weight=5 max_fails=1 fail_timeout=30s;
}
server {
listen 1234;
proxy_connect_timeout 30s;
proxy_timeout 30s;
proxy_pass aaa;
tcp_nodelay on;
resolver 8.8.8.8 ipv6=off;
}
}
aries910
2022-02-23 10:23:13 +08:00
@jifengg 是 1m 的
aries910
2022-02-23 10:35:31 +08:00
@Davic1
1.请问下 tcp 转发,可以用 http1.1 吗,具体怎么设置呢
2.搜了下,大部分都是在 stream 下设置 keepalive=16
3.实际也确实用的是比较大的端口
4.好像 worker_rlimit_nofile 65535 这句已经把 linxu 的文件句柄设置到 65535 了
dongpengfei1
2022-02-23 10:39:57 +08:00
你应该限制 nginx 的并发数和到上游的流量增加缓存数和等待时间,然后从系统上关闭 ipv6 。
aries910
2022-02-23 11:02:01 +08:00
@dongpengfei1
关键我希望 nginx 能承载尽可能多的连接,并发越高越好
就当是个压力测试吧
以此为目的,设置 nginx 以达到尽可能高的并发
Davic1
2022-02-23 11:02:28 +08:00
@aries910 4 层转发就和 http 没关系了.

你做压测的时候看 watch -n 1 "netstat -natpl|wc -l" 最高能到多少. ngx 做反向代理角色相当于客户端,local_port_range 是要设置一下的.

内核的参数我贴个你参考下
fs.file-max = 1048576
fs.nr_open = 1048576
kernel.msgmax = 65536
kernel.shmall = 4294967296
kernel.shmmax = 68719476736
kernel.sysrq = 0
net.core.netdev_max_backlog = 2000000
net.core.rmem_default = 699040
net.core.rmem_max = 50331648
net.core.somaxconn = 65535
net.core.wmem_default = 131072
net.core.wmem_max = 33554432
net.ipv4.ip_local_port_range = 1025 65000
net.ipv4.ip_nonlocal_bind = 1
net.ipv4.tcp_fin_timeout = 10
net.ipv4.tcp_keepalive_time = 300
net.ipv4.tcp_max_orphans = 3276800
net.ipv4.tcp_max_syn_backlog = 655360
net.ipv4.tcp_max_tw_buckets = 6000000
net.ipv4.tcp_mem = 94500000 915000000 927000000
net.ipv4.tcp_rmem = 32768 699040 50331648
net.ipv4.tcp_wmem = 32768 131072 33554432
net.ipv4.tcp_slow_start_after_idle = 0
net.ipv4.tcp_synack_retries = 2
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_syn_retries = 2
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_window_scaling = 1
net.ipv4.tcp_fastopen = 3
net.ipv4.tcp_mtu_probing = 1
vm.swappiness = 0
Lax
2022-02-23 11:47:52 +08:00
cat /proc/<pid>/limits 确认一下实际生效的 limits 配置。

那个 aaa.com 是内网服务还是公网服务?网络延时有多大?

测试的话,要把这个配置 max_fails=1 调高,尤其是网络不稳定的时候。
dongpengfei1
2022-02-23 11:47:57 +08:00
@aries910 主要你的上游受不了呀,都不接收消息了。那你增加缓存数,和等待时间试试。
cxh116
2022-02-23 13:13:18 +08:00
你的 upstream aaa 只能处理那么多请求,增大 nginx 没啥用,优化你的后端服务的并发吧。
NikoXu
2022-02-23 15:23:51 +08:00
tcp 转发用防火墙不就行了
NAPATA
2022-02-23 16:44:06 +08:00
nginx 设置 http1.1 的时候 keepalive 配多少比较好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/835813

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX