2021年1月15日10:36:06
昨晚19点发生了一排机器(不到10台)发生了重启,IDC的李工说超融合服务器的存储出问题了。无法远程服务器,访问web服务。我以为中招incaseformat病毒了。在23:30分修复成功,应该是存储问题,没中毒。
随后杀毒,net share xxx /delete 关网络共享等操作。好巧不巧,半夜另一边的服务器有个web应用无法访问了。
http://113.xxx.xx.xxx:8001 (公网) 无法访问 (服务器为192.168.1.100)
但是telnet 113.xxx.xx.xx.xxx 8001是通的。
在1.100服务器,本地运行localhost:8001是正常运行系统的随后换端口为8002 , 113.xxx.xxx.xxx:8002 和 localhost:8002都能正常访问。
这系统近几个月都是正常使用的,最近几周还搞了单点登录,个byd,也碰巧是昨晚出问题。
排查思路
排查思路:从内到外
1、本机localhost访问系统 , localhost:8080 、 192.168.1.100:80802、用旁边的机器(192.168.1.101),访问系统192.168.1.100:8080telnet 192.168.1.100 8080 、或者curl如果不通则检查1.100的防火墙 。 如果是域名连接的则看dns3、检查外部问题telnet 11x.xxx.xxx.xx 8080 看是否通查看总的防火墙NAT做的映射是否通
nat server protocol tcp global 113.xx.xx.xx 8001 8010 inside 192.168.1.103 8001 8010
经过检查总防火墙的端口映射是通的。
深信服AD作为负载转发,如果还不通则查看1.103的AD设备配置情况
最后发现是内部机器防火墙问题,防火墙一直开启的,添加开放对应端口上去即可,但怪比了,它已经正常用了几个月了。
=分割线
借着上面那拓扑图,也顺便简单说明下。域名,公网,NAT映射的东西(随笔)
域名:bd.xxxx.com
上面域名绑定的公网IP:113.xx.xx.xx要求开的NAT端口映射(H3C IPS):
机器21.10
nat server protocol tcp global 113.xx.xx.xx 9001 9010 inside xx.xx.21.10 9001 9010
机器22.18和22.19
nat server protocol tcp global 113.xx.xx.xx 9011 9020 inside xx.xx.22.18 9011 9020
nat server protocol tcp global 113.xx.xx.xx 9021 9025 inside xx.xx.22.19 9021 9025
机器21.11
nat server protocol tcp global 113.xx.xx.xx 9090 9095 inside xx.xx.21.11 9090 9095
nat server protocol tcp global 113.xx.xx.xx 9418 inside xx.xx.21.11 9418
nat server protocol tcp global 113.xx.xx.xx 10101 inside xx.xx.21.11 10101
就可外网访问了