虚拟机网络连接问题,求各位前辈支招

2017-06-30 17:40:27 +08:00
 netcan

先描述一下背景,我是学校实验室的队长,实验室有一台刀片机服务器。因为学长毕业了,自然轮到我来管理。

最近刀片机烧了,学校拿去报修,这两天送回来,数据无大碍。

刀片机是用 xen 虚拟化方案,主控是 CentOS 系统,为了方便说明,这里贴出主控的内网 ip 地址:172.18.6.104。然后我启动了 2 个虚拟服务器,一个是172.18.6.101,另一个是172.18.6.106,这两台虚拟机启动正常,都是 CentOS 系统。

奇怪的事情来了,我在其他机器上,ping 得通主控 104,却 ping 不通其 2 台虚拟机 106 和 101。

然后我又用 tracert 来追踪两条路径,得到如下结果( 101 和 106 情况一样):

~ ➤ traceroute 172.18.6.104
traceroute to 172.18.6.104 (172.18.6.104), 30 hops max, 60 byte packets
 1  172.18.72.254 (172.18.72.254)  0.255 ms  0.248 ms  0.241 ms
 2  192.168.222.186 (192.168.222.186)  0.571 ms  1.062 ms  1.084 ms
 3  172.18.6.104 (172.18.6.104)  0.249 ms  0.276 ms  0.291 ms
~ ➤ traceroute 172.18.6.106
traceroute to 172.18.6.106 (172.18.6.106), 30 hops max, 60 byte packets
 1  172.18.72.254 (172.18.72.254)  0.275 ms  0.270 ms  0.262 ms
 2  192.168.222.186 (192.168.222.186)  0.474 ms  0.583 ms  0.742 ms
 3  * * *
 4  * * *
 5  * * *
 6  * * *

从结果中可以看出,路径是一样的,但是到192.168.222.186这个交换机,就卡了,我觉得是交换机路由问题吧。

我咨询了一下老师,老师说 104 都通,怎么可能是路由交换的问题呢,104、106 都是一个实体机,共用的一个网卡,104 一直正常,这就说明线路、网络都是没问题。

然后我远程登录 ssh 104 这台主控,在主控上 ping 106,是通的。在主控上 ssh 登录 106 这台机器,发现有点奇怪,就是断断续续的,输入一个命令好久才回显,这时候,其他机器 ping 106,有时候是通的。

现在还没定位出问题,老师说可能是 ip 地址冲突了,问了下学长他说不可能;我也检查了防火墙问题,也不管用。

求各位前辈支支招,谢谢了。

补充一下 106 路由表:

[root@localhost ~]# route  -n
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
172.18.6.0      0.0.0.0         255.255.255.0   U     0      0        0 eth0
169.254.0.0     0.0.0.0         255.255.0.0     U     1002   0        0 eth0
0.0.0.0         172.18.6.254    0.0.0.0         UG    0      0        0 eth0

我发现这个 169.254 有点奇怪啊,查了下好像 DHCP 未分配到 ip 地址就是这个了。

2223 次点击
所在节点    程序员
10 条回复
imn1
2017-06-30 17:53:10 +08:00
我只想知道这帖的几个 tag 怎么算出来的?
xfspace
2017-06-30 18:05:00 +08:00
169.254.0.0/16 一般都是无法获取 IP 或 IP 冲突才会出现的地址
cftm82
2017-06-30 18:09:14 +08:00
169.254.0.0/16 都有,没关系。目测虚拟机和网关连接有问题。查下虚拟机 ping 网关通吗?
cftm82
2017-06-30 18:11:10 +08:00
不通的话查下和宿主机的网桥
netcan
2017-06-30 18:12:17 +08:00
貌似已经解决了,谢谢各位,我把 169.254.0.0/16 这个路由删了,就正常了。。。
netcan
2017-06-30 18:14:31 +08:00
删除路由表,过了几分钟貌似就正常了。
```
[root@localhost ~]# route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
172.18.6.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
169.254.0.0 0.0.0.0 255.255.0.0 U 1002 0 0 eth0
0.0.0.0 172.18.6.254 0.0.0.0 UG 0 0 0 eth0
[root@localhost ~]# route del -net 169.254.0.0/16 dev eth0
[root@localhost ~]# route -n
Kernel IP routing table
Destination Gateway Genmask Flags Metric Ref Use Iface
172.18.6.0 0.0.0.0 255.255.255.0 U 0 0 0 eth0
0.0.0.0 172.18.6.254 0.0.0.0 UG 0 0 0 eth0
[root@localhost ~]# w
16:31:52 up 51 min, 2 users, load average: 0.00, 0.01, 0.00
USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
root pts/0 172.18.6.104 15:45 3:11 0.36s 0.36s -bash
root pts/1 172.18.72.13 16:26 0.00s 0.02s 0.00s w
```
netcan
2017-06-30 18:15:55 +08:00
@cftm82 网关 172.18.6.254 一直都通,我觉得是 169.254.0.0 的问题,之前还真没见过这个。。。
trepwq
2017-06-30 18:36:21 +08:00
应该 dhcp client 插的路由,我曾经也遇到过,重启就好了,当然删了路由也行
netcan
2017-06-30 18:55:36 +08:00
@trepwq 诶,过一会又没用了- -治标不治本。。可是 101 和 106 都能 Ping 通网关。。
johnnie502
2017-06-30 21:43:58 +08:00
机架,刀片,傻傻分不清楚

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/372220

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX