Debian 12 bookworm
Sponsored Link

Ceph Pacific : OSD を追加/削除する2023/06/19

 
既存の Ceph クラスターに OSD を追加/削除するには、以下のように設定します。
                                         |
        +--------------------+           |           +----------------------+
        |   [dlp.srv.world]  |10.0.0.30  |  10.0.0.31|    [www.srv.world]   |
        |     Ceph Client    +-----------+-----------+        RADOSGW       |
        |                    |           |           |                      |
        +--------------------+           |           +----------------------+
            +----------------------------+----------------------------+
            |                            |                            |
            |10.0.0.51                   |10.0.0.52                   |10.0.0.53 
+-----------+-----------+    +-----------+-----------+    +-----------+-----------+
|   [node01.srv.world]  |    |   [node02.srv.world]  |    |   [node03.srv.world]  |
|     Object Storage    +----+     Object Storage    +----+     Object Storage    |
|     Monitor Daemon    |    |                       |    |                       |
|     Manager Daemon    |    |                       |    |                       |
+-----------------------+    +-----------------------+    +-----------------------+

[1] 例として、管理ノードから [node04] ノードを新たに OSD に追加します。
[node04] ノード上で Ceph 用に設定するブロックデバイスは [/dev/sdb] を使用します。
# 公開鍵転送

root@node01:~#
ssh-copy-id node04

# 必要なパッケージをインストール

root@node01:~#
ssh node04 "apt update; apt -y install ceph"
# 必要なファイルを転送

root@node01:~#
scp /etc/ceph/ceph.conf node04:/etc/ceph/ceph.conf

root@node01:~#
scp /etc/ceph/ceph.client.admin.keyring node04:/etc/ceph

root@node01:~#
scp /var/lib/ceph/bootstrap-osd/ceph.keyring node04:/var/lib/ceph/bootstrap-osd
# OSD の設定

root@node01:~# ssh node04 \
"chown ceph:ceph /etc/ceph/ceph.* /var/lib/ceph/bootstrap-osd/*; \
parted --script /dev/sdb 'mklabel gpt'; \
parted --script /dev/sdb "mkpart primary 0% 100%"; \
ceph-volume lvm create --data /dev/sdb1" 
Running command: /usr/bin/ceph-authtool --gen-print-key
Running command: /usr/bin/ceph --cluster ceph --name client.bootstrap-osd --keyring /var/lib/ceph/bootstrap-osd/ceph.keyring -i - osd new 80de1be1-a7bd-456a-bd31-9e3c6d561659
Running command: vgcreate --force --yes ceph-d8acd8eb-5414-4fb3-b462-e8ac22dd7c63 /dev/sdb1
 stdout: Physical volume "/dev/sdb1" successfully created.
 stdout: Volume group "ceph-d8acd8eb-5414-4fb3-b462-e8ac22dd7c63" successfully created
Running command: lvcreate --yes -l 40959 -n osd-block-80de1be1-a7bd-456a-bd31-9e3c6d561659 ceph-d8acd8eb-5414-4fb3-b462-e8ac22dd7c63
 stdout: Logical volume "osd-block-80de1be1-a7bd-456a-bd31-9e3c6d561659" created.
.....
.....
 stderr: Created symlink /etc/systemd/system/multi-user.target.wants/ceph-volume@lvm-3-80de1be1-a7bd-456a-bd31-9e3c6d561659.service → /lib/systemd/system/ceph-volume@.service.
Running command: /usr/bin/systemctl enable --runtime ceph-osd@3
 stderr: Created symlink /run/systemd/system/ceph-osd.target.wants/ceph-osd@3.service → /lib/systemd/system/ceph-osd@.service.
Running command: /usr/bin/systemctl start ceph-osd@3
--> ceph-volume lvm activate successful for osd ID: 3
--> ceph-volume lvm create successful for: /dev/sdb1

# 一定時間経過後に HEALTH_OK となれば OK
root@node01:~# ceph -s 
  cluster:
    id:     f6eabaad-6442-481b-bfb1-0bb79de773e3
    health: HEALTH_OK

  services:
    mon: 1 daemons, quorum node01 (age 5m)
    mgr: node01(active, since 16s)
    mds: 1/1 daemons up
    osd: 4 osds: 4 up (since 4m), 4 in (since 11m)
    rgw: 1 daemon active (1 hosts, 1 zones)

  data:
    volumes: 1/1 healthy
    pools:   8 pools, 225 pgs
    objects: 247 objects, 14 KiB
    usage:   67 MiB used, 640 GiB / 640 GiB avail
    pgs:     225 active+clean
[2] 既存のクラスターから OSD を削除する場合は以下のように実行します。
例として、管理ノードから [node04] ノードを削除します。
root@node01:~#
ceph -s

  cluster:
    id:     f6eabaad-6442-481b-bfb1-0bb79de773e3
    health: HEALTH_OK

  services:
    mon: 1 daemons, quorum node01 (age 5m)
    mgr: node01(active, since 16s)
    mds: 1/1 daemons up
    osd: 4 osds: 4 up (since 4m), 4 in (since 11m)
    rgw: 1 daemon active (1 hosts, 1 zones)

  data:
    volumes: 1/1 healthy
    pools:   8 pools, 225 pgs
    objects: 247 objects, 14 KiB
    usage:   67 MiB used, 640 GiB / 640 GiB avail
    pgs:     225 active+clean

root@node01:~#
ceph osd tree

ID  CLASS  WEIGHT   TYPE NAME        STATUS  REWEIGHT  PRI-AFF
-1         0.62476  root default
-3         0.15619      host node01
 0    hdd  0.15619          osd.0        up   1.00000  1.00000
-5         0.15619      host node02
 1    hdd  0.15619          osd.1        up   1.00000  1.00000
-7         0.15619      host node03
 2    hdd  0.15619          osd.2        up   1.00000  1.00000
-9         0.15619      host node04
 3    hdd  0.15619          osd.3        up   1.00000  1.00000

# 削除したい OSD の ID を指定してクラスターから分離する

root@node01:~#
ceph osd out 3

marked out osd.3.
# クラスターステータスを リアルタイムウォッチ する
# [ceph osd out ***] 実行後、リバランスが実行されデータが再配置される
# リアルタイムウォッチを終了する場合は [Ctrl + c]

root@node01:~#
ceph -w

  cluster:
    id:     f6eabaad-6442-481b-bfb1-0bb79de773e3
    health: HEALTH_WARN
            Degraded data redundancy: 127/741 objects degraded (17.139%), 26 pgs degraded

  services:
    mon: 1 daemons, quorum node01 (age 6m)
    mgr: node01(active, since 89s)
    mds: 1/1 daemons up
    osd: 4 osds: 4 up (since 5m), 3 in (since 16s); 2 remapped pgs
    rgw: 1 daemon active (1 hosts, 1 zones)

  data:
    volumes: 1/1 healthy
    pools:   8 pools, 225 pgs
    objects: 247 objects, 14 KiB
    usage:   58 MiB used, 480 GiB / 480 GiB avail
    pgs:     127/741 objects degraded (17.139%)
             2/741 objects misplaced (0.270%)
             194 active+clean
             24  active+recovery_wait+degraded
             4   active+recovery_wait
             2   active+recovery_wait+undersized+degraded+remapped
             1   active+recovering

  io:
    recovery: 119 B/s, 0 keys/s, 5 objects/s

  progress:

2023-06-19T00:39:12.810651-0500 mon.node01 [WRN] Health check update: Degraded data redundancy: 61/741 objects degraded (8.232%), 14 pgs degraded (PG_DEGRADED)
.....
.....

# クラスターステータスが [HEALTH_OK] になったのち、対象ノードの OSD サービスを無効化

root@node01:~#
ssh node04 "systemctl disable --now ceph-osd@3.service"

# 対象ノードの OSD ID を指定してクラスターから削除する

root@node01:~#
ceph osd purge 3 --yes-i-really-mean-it

purged osd.3
root@node01:~#
ceph -s

  cluster:
    id:     f6eabaad-6442-481b-bfb1-0bb79de773e3
    health: HEALTH_OK

  services:
    mon: 1 daemons, quorum node01 (age 61s)
    mgr: node01(active, since 33s)
    mds: 1/1 daemons up
    osd: 3 osds: 3 up (since 24s), 3 in (since 5m)
    rgw: 1 daemon active (1 hosts, 1 zones)

  data:
    volumes: 1/1 healthy
    pools:   8 pools, 225 pgs
    objects: 247 objects, 15 KiB
    usage:   67 MiB used, 480 GiB / 480 GiB avail
    pgs:     225 active+clean

  io:
    client:   3.9 KiB/s rd, 716 B/s wr, 3 op/s rd, 0 op/s wr
関連コンテンツ