vSAN環境に於いて、ドライブ交換時はメンテナンスモードを利用する必要があるか?

さて、土日を迎えたわけですが、来週はブレードサーバーと相も変わらずvSphere vSAN 6.2 Deploy & Manageのトレーニング提供です。

やるたびやるたび話したい内容が増えていきます。

 

さて、前回のトレーニング中に受けた質問にこんなものがありました。

■トレーニング受講生のGさん:すいません、資料には”ドライブ交換の際って、ESXiはメンテナンスモードにする必要がありますか?”

■私:いや、特に不要だと思われます。でもよく見ると確かにスライドにそういう記述がありますね。ホットプラグ非対応なサーバーをシャットダウンする時には設定が必要と言えるから載ってるようにも見えますね。

実際前に私が擬似障害を発生させた場合は、メンテナンスモードにしなくともオブジェクトの再同期はうまく行きました。この経験に基づけば、不要かな、とも言えます。

しかし、どうにもスライドで態々メンテナンスモードにすると書いてある記載がどうにも気になり調べてみました。

 

 

で、ここに行き着いたわけです。困ったときのコーマック・ホーガン先生です。

blogs.vmware.com

コーマック先生によると、VMwareはディスクグループまたはディスクの交換を安全に行うためのは、データをなるべく退避し交換作業を行うことを強く勧める、とのことです。

なるほど、まぁ安全性という意味では確かに、と頷けます。

また、ディスク交換に関連するページでも、次のように交換作業時のデータ欠損リスクを無くすために、データ退避を勧めていますね。

VMware vSphere 6.5 Documentation Library

しかし、ディスク交換のために正常稼働しているディスク上のデータの移行も発生するわけであります。またメンテナンスモードに投入したvSAN  クラスターノードはディスクグループ上のキャッシュとキャパシティの提供を行わなくなります。

VMware vSphere 6.5 Documentation Library

これらの点から言えるのは、vSAN クラスター内で、メンテナンスモードに設定されるホストが提供する空き容量が大きい場合、メンテナンスモード投入後に空き容量が不足する可能性が考えられるため、ノードごとの提供容量が均一化されている方が、単一ノードのメンテナンスモード設定による影響が低減出来ることを意味します。

(極端にノード間でディスク容量に差がある場合、高キャパシティを提供するノードの欠損はクラスターに対しいい影響があるとは言いづらいです)

また、それだけではなく、DRS(Distributed Resource Scheduler)を利用している環境では、メンテナンスモードに伴う、自動vMotionも誘発されるため、自ずとメンテナンスモードに設定されるコンピュートリソース(CPU, メモリ)も、一時的に減ることを意味します。

 

と、言うことはデータ退避が目的のはずのメンテナンスモードであるにも関わらず、コンピュートリソースまで減るのは少し影響があるように見えます。

ここでコーマック先生は続けて次のようにコメントしています。

 vSAN 6.0からはメンテナンスモードにしなくとも、ディスクグループ削除またはディスクの削除時にデータ移行のオペレーションが出来るようになった、と言っています。

確かに、6.0からは仕様が変更されており、メンテナンスモードでなくともこれらのオペレーションは出来ます。

そういう意味では、6.0以降であれば必ずしもメンテナンスモードでなくとも、データ退避は出来ますからこちらの手法でもいいかもしれませんね。

 

ということで、今回は次の結論に行き着いたと言えます。

結論:VMwareとしては、ディスク交換時には、関連ディスクグループ内のデータを移動することを推奨している。(つまり、メンテナンスモードにすることを推奨にしているわけではないようです)

但し、3ノードクラスターでのFTT=1構成など、構成規模によってはデータ移行が出来ない環境もあるため、そうした環境ではその次第ではないことも念頭においておく必要が有るといえます。

コメント