一个Oracle监听问题的网络排查

时间:2022-05-05
本文章向大家介绍一个Oracle监听问题的网络排查,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

今天在梳理一套环境的时候,发现了一个奇怪的问题,应用端连接正常,但是服务端却有些问题。

假设服务端的IP地址为10.129.128.57

使用tnsping本机的服务,竟然抛出了监听的问题。

$ tnsping s2gamebbs Attempting to contact (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = s2gamebbs.test.com)(PORT = 1528)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = gamebbs))) TNS-12541: TNS:no listener

是监听没启动吗,查看监听进程存在,确实是启动了,但是查看监听状态却抛出了错误

LSNRCTL> status listener_1528 Connecting to (DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=s2gamebbs.test.com)(PORT=1528))) TNS-12541: TNS:no listener TNS-12560: TNS:protocol adapter error TNS-00511: No listener Linux Error: 111: Connection refused

这个问题立马勾起了我的兴趣,我使用域名解析的方式查看是没有问题的。

$ ping `hostname` PING s2gamebbs.cyou.com (10.129.128.57) 56(84) bytes of data. 64 bytes from s2gamebbs.test.com (10.129.128.57): icmp_seq=1 ttl=64 time=0.059 ms 。。。 ^C

但是ping服务器的IP是有问题的。

# ping 10.129.128.57 PING 10.129.128.57 (10.129.128.57) 56(84) bytes of data. From 10.129.128.57 icmp_seq=1 Destination Port Unreachable From 10.129.128.57 icmp_seq=2 Destination Port Unreachable 如此一来,这个问题就有趣了,我对比了如下的几种测试场景。

# telnet 10.129.128.57 1528 Trying 10.129.128.57... telnet: connect to address 10.129.128.57: Connection refused # telnet 127.0.0.1 1528 Trying 127.0.0.1... telnet: connect to address 127.0.0.1: Connection refused # telnet `hostname` 1528 Trying 10.129.128.57... telnet: connect to address 10.129.128.57: Connection refused 同时做了strace调试,也没有看到明显的问题,于是我怀疑是网络层面解析的问题,/etc/hosts的文件看了很多遍没有问题,那就只有网络层面,比如防火墙了,我开始琢磨防火墙里的配置。 看到了下面的一段:

-A INPUT -s 10.10.75.59/32 -j ACCEPT -A INPUT -p udp -j ACCEPT -A INPUT -m state --state RELATED,ESTABLISHED -j ACCEPT -A INPUT -j REJECT --reject-with icmp-port-unreachable其中最后的一句是关键,如果倒数两句的顺序调整一下,上面的错误就会完全不一样。

这个参数其实的设定其实也是一种安全策略,如果能够扫描到我们的端口,但是却没法得知我们的网络访问是否在防火墙控制下,当然这个地方的设置伤害到“自己人”了。所以暂不需要。

去掉折后,重新启动防火墙,问题就得到了解决。