ceph分布式存储-单个Ceph节点宕机处理

时间:2022-07-22
本文章向大家介绍ceph分布式存储-单个Ceph节点宕机处理,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

5. 单个Ceph节点宕机处理

在某些情况下,如服务器硬件故障,造成单台 Ceph 节点宕机无法启动,可以按照本节所示流程将该节点上的 OSD 移除集群,从而达到 Ceph 集群的恢复。

5.1 单台 Ceph 节点宕机处理步骤

  1. 登陆 ceph monitor 节点,查询 ceph 状态: ceph health detail
  2. 将故障节点上的所有 osd 设置成 out,该步骤会触发数据 recovery, 需要等待数据迁移完成, 同时观察虚拟机是否正常: ceph osd out osd_id
  3. 从 crushmap 将 osd 移除,该步骤会触发数据 reblance,等待数据迁移完成,同时观察虚拟机是否正常: ceph osd crush remove osd_name
  4. 删除 osd 的认证: ceph auth del osd_name
  5. 删除 osd :ceph osd rm osd_id