kubernetes排错系列:(一)、机房搬迁导致的节点NotReady

时间:2019-08-21
本文章向大家介绍kubernetes排错系列:(一)、机房搬迁导致的节点NotReady,主要包括kubernetes排错系列:(一)、机房搬迁导致的节点NotReady使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

说下背景:

  上周六机房进行搬迁,我所在的网段的机器都重启了一遍。重启之后kubernetes集群不正常。如下

排查过程:

# 查看节点信息
kubectl describe nodes cbov10-sso55-113

时间正好是上周五搬迁的时间点,20190809,kubelet停止发布节点状态

# 查看kubelet状态
systemctl status kubelet.service

这时候看出,报错名之k8s-master,但是我们kubernetes集群的node名字是cbov10-sso55-113,显然主机名有问题。

解决:

1. 查看是哪里的主机名出来问题。一般是两个地方

# 1. 查看 /etc/hosts
cat /etc/hosts

# 2.  查看 /etc/sysconfig/network
cat  /etc/sysconfig/network

博主这边是  /etc/sysconfig/network  加 HOSTNAME 写死 了,没关系,我们修改为需要的 cbov10-sso55-113,(这里说下,去掉HOSTNAME,用OpenStack自己虚出来的默认的虚拟机名也可以)

2.  修改主机名

# 方法1:临时有效
# 只能临时修改的主机名,当重启机器后,主机名称又变回来了。
hostname 主机名    

# 方法2:永久生效
# 永久性的修改主机名称,重启后能保持修改后的。
hostnamectl set-hostname  主机名

3.退出xshell,重新登录

# 查看主机名
hostnamectl

# 重启kubelet
systemctl daemon-reload
systemctl restart kubelet.service

4.再次查看kubernetes集群状态,可以发现集群状态为Ready

kubectl get nodes

感谢您的观看。

原文地址:https://www.cnblogs.com/haoprogrammer/p/11350664.html