在网络的管理运维过程中,可以说故障是不可避免的。如果有管理员企图打造零故障的网络,只能是徒劳。因为网络故障有太多的随机性和偶然性,何况还有人为因素。所以,管理员要做的是掌握网络排错技巧,积累经验培养敏锐的嗅觉,能够少走弯路,快速定位并排除故障。笔者做技术支持时目睹过不少网管的排错过程,也看过一些别人的排错文章,发现有不少人有意或者无意地走了不少弯路。下面很大家共享两例网络排错案例,希望对朋友们有所启发。
案例一:病毒优艾设计网_PS问答引发的网络故障
故障现象
早上刚上班,用户打来电话说某个子网的客户端无法正常上网。并且反馈信息,在PingDNS时断时续,远程登录三层交换机,检查连接用户办公楼端口,未发现有异常情况。
故障诊断
笔者建议管理员首先检查网络是否出现风暴或网络回环。打开Sniffer软件监控用户所在网络,看是不是出现流量异常的现象,监控两个小时后发现流量很正常。很奇怪,据用户反映在中午下班时网络正常恢复正常,但是下午用户又打来电话说网络又不正常了,初步判断问题出在用户端。
笔者让管理员到用户办公室逐个排查。根据用户反映,如果把网卡禁用后再启用,网络就正常了,但过10分钟又无法ping通,周而复始。我们知道,网卡禁用再启用的过程,就是一个Arp的学习过程,在此期间,它会发出一个Arp的请求,询问谁是这个网段的网关,然后得到这个网关的MAC地址,然后当它需要去访问不同网段机器的时候,就会把数据包丢给那个网关。那么,是不是用户的某台机器中了病毒,导致它可以模仿真实网关的地址,使得在局域网内的客户端在上网时都把数据包发给了这个模仿真实网关的机器,从而产生故障?马上找了一台机器用arp-a命令去查看这台机器默认网关的MAC地址,发现当网络正常时显示的默认网关的MAC地址是正确的,当故障出现时默认网关的MAC地址突然变了。
精彩评论