CEPH
    CEPH
    • CEPH
    • Ceph 恢复速度优化指南
    • CEPH,PG操作
    • BlueStore替换硬盘
    • Ceph去掉PG操作步骤
    • ceph离线osd处理
    • CEPH集群的健康指标
    • CEPH删除OSD
    • VG扩容
    • CEPH更换硬盘

    Ceph去掉PG操作步骤

    一、删除丢失的PG#

    1. 诊断和确认PG的丢失#

    使用Ceph的命令行工具ceph pg dump命令来检查和诊断PG的状态。运行该命令后,将返回一个包含所有PG信息的列表。需要关注处于状态“down”、“incomplete”和“stale”等异常状态的PG,这些状态表明PG存在问题,需要进行进一步处理。示例如下:

    2. 尝试修复丢失的PG#

    使用ceph pg repair命令来修复丢失的PG。该命令会尝试从其他处于活动状态的副本中恢复丢失的PG数据。然而,并不是所有的PG都可以成功修复。有时,由于数据丢失或其他原因,PG无法完全恢复。在这种情况下,需要采取其他措施。示例如下:
    其中<pgid>是需要修复的PG的ID。

    3. 标记丢失的PG为删除状态#

    使用ceph pg rm命令将丢失的PG标记为删除状态。运行该命令后,Ceph将不再尝试修复该PG,而是将其视为已删除。这是一个必要且重要的步骤,以确保集群的稳定性和性能。示例如下:
    其中<pgid>是需要删除的PG的ID,<poolname>是该PG所在的存储池名称。

    4. 等待PG被完全删除#

    删除一个PG需要一定的时间。可以使用ceph pg stat命令来检查PG的状态。当PG的状态变为“degraded+remapped”时,意味着该PG已被成功删除。在此之后,可以继续进行其他维护和操作。示例如下:

    注意事项#

    在删除之前,请确保已经尝试过修复丢失的PG。只有在修复失败的情况下,才应该标记PG为删除状态。
    在删除过程中,建议监控集群的状态和性能。可以使用Ceph的监控工具来检查集群中其他PG的状态,并确保删除过程不会对集群产生负面影响。
    在删除PG之前,请确保已经有足够的冗余副本和备份,以防止数据丢失或损坏。

    二、从当前OSD移除PG#

    1. 停止相关OSD服务#

    在进行操作之前,需要停止当前操作的OSD,否则会报错。示例如下:
    其中<osd_number>是需要停止的OSD的编号。

    2. 使用ceph-objectstore-tool工具移除PG#

    使用ceph-objectstore-tool工具的remove操作从当前OSD移除PG。示例如下:
    其中<osd_number>是OSD的编号,<pgid>是需要移除的PG的ID。

    3. 启动OSD服务#

    移除PG后,启动OSD服务。示例如下:
    其中<osd_number>是需要启动的OSD的编号。

    没有pg rm命令#

    image.png
    image.png
    image.png
    修改于 2025-04-28 01:41:17
    上一页
    BlueStore替换硬盘
    下一页
    ceph离线osd处理
    Built with