Debian 12 bookworm
Sponsored Link

Pacemaker : フェンスデバイスを設定する2023/07/27

 

クラスターにフェンスデバイスを設定します。(フェンシングの概要は下記サイト参照)

https://access.redhat.com/documentation/ja-jp/red_hat_enterprise_linux/8/html/configuring_and_managing_high_availability_clusters/s1-fencing-haao

フェンスデバイスには APC 電源スイッチや IPMI 等々、多くが利用可能ですが、当例では、ストレージベースのフェンスデバイスを利用します。
例として、以下のように ISCSI Target のストレージを使用して SCSI フェンシングを設定します。
事前にクラスターの基本構成を設定していることが前提です

                        +--------------------+
                        | [  ISCSI Target  ] |
                        |    dlp.srv.world   |
                        +---------+----------+
                         10.0.0.30|
                                  |
+----------------------+          |          +----------------------+
| [  Cluster Node#1  ] |10.0.0.51 | 10.0.0.52| [  Cluster Node#2  ] |
|   node01.srv.world   +----------+----------+   node02.srv.world   |
|                      |                     |                      |
+----------------------+                     +----------------------+

[1]

こちらを参考に、ISCSI ターゲット サーバーにフェンスデバイス用のストレージを作成しておきます
当例では、IQN (iSCSI Qualified Name) を [iqn.2023-06.world.srv:dlp.target01] として [10M] のストレージを設定しています。

[2]

こちらを参考に、クラスターを構成する全ノードで、ISCSI ターゲット サーバーにログインしておきます。 (ログインまでで OK)

[3] フェンスデバイスを設定します。いずれかのノード上で設定すれば OK です。
下例の [sda] は ISCSI ターゲット サーバーのストレージです。
# ディスク ID 確認

root@node01:~#
ll /dev/disk/by-id | grep sda | grep wwn

lrwxrwxrwx 1 root root  9 Jul 26 21:03 wwn-0x60014052bd00ea23cc44e5a9a8e749f8 -> ../../sda

# フェンシングを設定
# [scsi-shooter] : 任意の名称
# [pcmk_host_list=***] : クラスター構成ノードを指定
# [devices=***] : ISCSI ターゲット サーバーのストレージ

root@node01:~#
pcs stonith create scsi-shooter fence_scsi pcmk_host_list="node01.srv.world node02.srv.world" devices=/dev/disk/by-id/wwn-0x60014052bd00ea23cc44e5a9a8e749f8 meta provides=unfencing
# 設定確認

root@node01:~#
pcs stonith config scsi-shooter

Resource: scsi-shooter (class=stonith type=fence_scsi)
  Attributes: scsi-shooter-instance_attributes
    devices=/dev/disk/by-id/wwn-0x60014052bd00ea23cc44e5a9a8e749f8
    pcmk_host_list="node01.srv.world node02.srv.world"
  Meta Attributes: scsi-shooter-meta_attributes
    provides=unfencing
  Operations:
    monitor: scsi-shooter-monitor-interval-60s
      interval=60s

# ステータス確認
# 設定したフェンスデバイスが [Started] であれば OK

root@node01:~#
pcs status

Cluster name: ha_cluster
Status of pacemakerd: 'Pacemaker is running' (last updated 2023-07-26 21:09:59 -05:00)
Cluster Summary:
  * Stack: corosync
  * Current DC: node02.srv.world (version 2.1.5-a3f44794f94) - partition with quorum
  * Last updated: Wed Jul 26 21:10:00 2023
  * Last change:  Wed Jul 26 21:09:37 2023 by root via cibadmin on node01.srv.world
  * 2 nodes configured
  * 1 resource instance configured

Node List:
  * Online: [ node01.srv.world node02.srv.world ]

Full List of Resources:
  * scsi-shooter        (stonith:fence_scsi):    Started node01.srv.world

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled
[4] 設定したフェンスデバイスが正常に機能するか、フェンシングのテストを実施します。
root@node02:~#
pcs status

Cluster name: ha_cluster
Status of pacemakerd: 'Pacemaker is running' (last updated 2023-07-26 21:10:35 -05:00)
Cluster Summary:
  * Stack: corosync
  * Current DC: node02.srv.world (version 2.1.5-a3f44794f94) - partition with quorum
  * Last updated: Wed Jul 26 21:10:36 2023
  * Last change:  Wed Jul 26 21:09:37 2023 by root via cibadmin on node01.srv.world
  * 2 nodes configured
  * 1 resource instance configured

Node List:
  * Online: [ node01.srv.world node02.srv.world ]

Full List of Resources:
  * scsi-shooter        (stonith:fence_scsi):    Started node01.srv.world

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

# フェンシングのテスト

root@node02:~#
pcs stonith fence node01.srv.world

Node: node01.srv.world fenced
# ノードは [OFFLINE] になり再起動される

root@node02:~#
pcs status

Cluster name: ha_cluster
Status of pacemakerd: 'Pacemaker is running' (last updated 2023-07-26 21:11:03 -05:00)
Cluster Summary:
  * Stack: corosync
  * Current DC: node02.srv.world (version 2.1.5-a3f44794f94) - partition with quorum
  * Last updated: Wed Jul 26 21:11:03 2023
  * Last change:  Wed Jul 26 21:09:37 2023 by root via cibadmin on node01.srv.world
  * 2 nodes configured
  * 1 resource instance configured

Node List:
  * Online: [ node02.srv.world ]
  * OFFLINE: [ node01.srv.world ]

Full List of Resources:
  * scsi-shooter        (stonith:fence_scsi):    Started node02.srv.world

Daemon Status:
  corosync: active/enabled
  pacemaker: active/enabled
  pcsd: active/enabled

# 再起動後 手動で [Online] に戻す場合は以下

root@node02:~#
pcs cluster start node01.srv.world

関連コンテンツ