VMware Certified Master Specialist – HCI 試験対策まとめ

VMware
  1. VMware Certified Master Specialist – HCI 試験対策まとめ
    1. 試験概要
    2. 試験準備ガイド
      1. Section 1 – アーキテクチャとテクノロジー(この試験では問われません)
      2. Section 2 – VMwareプロダクトとソリューション
        1. Objective 2.1 – vSphere Replicationの構成(ストレージポリシーの効果)
        2. Objective 2.2 – vRealize OperationsとvSANの展開
      3. Section 3 – 計画とデザイン
        1. Objective 3.1 – vSANデザインの考慮事項における定義とデモ(ポリシー、フォルトドメイン、ディスクグループ、vmkernel トラフィック、VCG、ネットワークなど)
          1. ストレージポリシー
          2. フォルトドメイン
          3. ディスクグループ
          4. vmkernel トラフィック
        2. Objective 3.2 – vSANクラスターの設計(可用性、キャパシティ層、耐障害性など)
        3. Objective 3.3 – vSANデザインとサイジングツール(ワークロードのためのキャッシュサイズ、仮想マシンサイジング、Live Optics、HCI Benchなど)
        4. Section 4 インストールと構成とセットアップ
        5. Objective 4.1 – vSAN環境の構成と検証(ネットワーク、vSAN 健全性、vSAN Quick Start、フォルトドメイン)
          1. vSAN 健全性
          2. vSAN Quick Start
        6. Objective 4.2 – ディスクグループの作成と管理
        7. Objective 4.3 – 検証されたvSANサービスの構成(iSCSIターゲットサービス、vSAN暗号化、vSAN フォルトドメイン、vSAN 健全性チェック、重複排除と圧縮等)
          1. iSCSIターゲットサービス
          2. vSAN 暗号化
          3. フォルトドメイン
          4. vSAN 健全性
          5. 重複排除と圧縮
        8. (作成中)Objective 4.4 – ストレッククラスターと2ノードvSANの設定
        9. (作成中)Objective 4.5 – 正しいポリシーを持ったクラウドネイティブストレージの設定(コンテナボリュームが正しいポリシー、データストアに関連付けられていることを確認する) 
      4. Section 5 パフォーマンスチューニング、最適化、アップグレード
        1. Objective 5.1 – アップグレード要件の決定
        2. Objective 5.2 – vSphere Update Managerによるパッチ適用
        3. Objective 5.3 – VUMを使ったHCIのアップグレード(エアギャップ環境) 
        4. Objective 5.4 – クラスターからのホストの増設と削除
        5. Objective 5.5 – メンテナンスモードオプションの利用ケースの評価
        6. Objective 5.6 – ディスクグループの作成、拡張、再構成、削除
        7. Objective 5.7 – vSAN HealthとVUM、互換性ガイドを利用したファームウェアとドライバーの管理
        8. Objective 5.8 – VUMのベースラインプリファレンスの設定
      5. Section 6 トラブルシューティングと修復
        1. Objective 6.1 – 障害シナリオの確認(ファームウェアとハードウェア互換性、ESXiホストの障害、ディスク、ハードウェア、ネットワークの障害、vSAN障害復旧、DDHなど)
        2. Objective 6.2 – vSAN健全性の警告の解釈(ディスクリバランス、輻輳、ハードウェア互換性、オブジェクトステータスなど)
        3. (作成中)Objective 6.3 – vSphere Host Clientとesxcli用いたvSAN健全性チェック
        4. (作成中)Objective 6.4 – UI及びvsantopコマンドによるパフォーマンスの評価
        5. Objective 6.5 – ハードウェア交換の管理(デバイス障害、ディスク交換、ホストの入れ替え)
        6. Objective 6.6 – 再同期の影響監視
        7. Objective 6.7 – 関連付けられていないオブジェクトを特定して削除し、容量を回収する
        8. Objective 6.8 – ストレージポリシーによる容量問題の解消(容量不足に陥っている際に、正しい手順を持って健全性を正す)
        9. Objective 6.9 – オブジェクトのコンプライアンス問題の解決
        10. Objective 6.10 – ネットワーク診断モード、オプションの構成とセットアップ
      6. Section 7 管理と運用タスク
        1. Objective 7.1 – vSANのデータ配置変更の説明
        2. Objective 7.2 – vSAN パフォーマンスメトリックスの評価(IOPS、輻輳、遅延、スループット、vsantop、再同期)
        3. Objective 7.3 – メンテナンスモードオプションの効果の説明(UIとCLI、新機能など)
        4. Objective 7.4 – ストレージポリシーのコンプライアンス監視
        5. (作成中)Objective 7.5 – ヘルスチェックの解釈(アラートのアクション、アラートの解決、オンラインヘルスの構成、vSANオブジェクト健全性の評価)
        6. Objective 7.6 – ポリシー変更に伴う影響の理解(容量、冗長性、IOPS制限)
        7. (作成中)Objective 7.7 – クラスターの不整合問題の確認と健全性チェックを通じた修正(健全性チェック画面からの修正の実行)
    3. 関連リンク

VMware Certified Master Specialist – HCI 試験対策まとめ

vSAN Specialist試験に続き、更にその上を行くレベルとしてのハイパーコンバージドインフラストラクチャ向けの認定試験が出ました。

認定資格試験の情報リンクはこちらです。VMware HCI Master Specialist

今回は近々私自身が本試験の受験を考えており、自分自身のための試験準備として試験対策用に情報をまとめたものが本記事です。

試験概要

試験内容としては、VCP試験とほぼ同じようです。選択問題のようですので、VCAPのような実操作は無いようです。Professional VMware vSphere 6.7の場合と比べて見た所気になるのが試験提供形式がどうやら複数選択式しかないように見えます。

Master試験という名前だけあって、簡単にはパスさせないという意気込みを感じます。

試験準備ガイド

Exam Preparation Guideが同試験紹介ページ内にありますが、案の定英語です。ということで試験範囲について全て日本語化してみました。

Section 1 – アーキテクチャとテクノロジー(この試験では問われません)

基本的なアーキテクチャや仕組みについては、vSAN Specialistレベルで確認済みという事でしょう。

是非ご自身のスキルチェックをされたいという方は、以下のリンク内に問題集を作成しておりますので、よければチャレンジしてみてください。

lab8010.com

Section 2 – VMwareプロダクトとソリューション

Objective 2.1 – vSphere Replicationの構成(ストレージポリシーの効果)

ストレージが持つ代表的な機能の1つに”Replication”がありますね。vSANデータストアは、レプリカデータの保存先(保護ストレージ)として活用が可能です。

vSANデータストア上に仮想マシンのデータを配置した際に、仮想マシンのオブジェクトはどのように保存されるのか、ということに対する理解を試される模様です。

公式ドキュメントでは次のページ内にポリシー適用後のコンポーネント数についての言及があります。ポイントは差分ディスク1つ辺り、1つのオブジェクトとして存在するため、コンポーネントの数がスナップショットの回数分増えるということですね。

docs.vmware.com

また最近ではvSANデータストアのバージョンが一定以上である際にはRPOを5分として設定も可能となりましたのでこの点もレプリケーション絡みということで少し気になります。

docs.vmware.com

Objective 2.2 – vRealize OperationsとvSANの展開

vRealize Operations Managerを使えば、既存のvSphere環境は勿論、プラグインをインストールしているサードパーティー製品はパブリッククラウド環境もデータに基づいた予測を含めてよりプロアクティブに管理が出来ます。実はvSAN環境の監視にも既に対応をしています。

本項では、vRopsを使ったvSAN監視について問われることを宣言しているようですが、対応バージョンを見てみたいと思います。

VMware製品の相互運用性マトリックスに基づきますと、vSAN 6.7 U1以降ではvRops 7以降が利用可能です。

vSAN 6.7系とvRops 7系の組み合わせで検証されているのがkwmt氏のブログですね。kwmtlog.blogspot.com

早速拝見させていただきましたが、vSphere ClientからvRopsのデータを閲覧出来るのは嬉しいですね。(監視者の目線では見る画面が少し変わるだけでも、監視のために覚え直すことが出てしまうのはちょっと大変ですね)

勿論実際の環境操作も試験用にしておくのは大事ですね。

HOL-2001-01-CMP – vRealize Operations 7.5 – What’s new

HOL-2001-04-CMP – VREALIZE OPERATIONS AND VREALIZE LOG INSIGHT – TROUBLESHOOT, REMEDIATE ISSUES AND ENSURE COMPLIANCE 

なお、上記のHOL内にはvSAN管理としてInteractive Simulatorがあります。こちらのリンクからダイレクトにアクセスが出来ますので、ご興味が有る方はアクセスしてみてください。

Section 3 – 計画とデザイン

Objective 3.1 – vSANデザインの考慮事項における定義とデモ(ポリシー、フォルトドメイン、ディスクグループ、vmkernel トラフィック、VCG、ネットワークなど)
ストレージポリシー

vSAN ポリシーの使用 – VMware Docs

vSANにおけるポリシーと言えば、ストレージポリシーです。
vSAN 6.7時点では冗長化、パフォーマンス、キャパシティ、その他で合計8種類のルールがあります。一部はオールフラッシュ限定、ハイブリッド限定のものもあります。

フォルトドメイン

フォルトドメインはラックアウェアなコンポーネント配置を提供してくれる機能ですね。

Fault Domains – VMware vSAN Design and Sizing Guide
Design and Operation Considerations When Using vSAN Fault Domains

上図では6つのラックがあるので、6つのフォールトドメインが構成されています。

また、仮想マシン1台がRAID1/FTT=1で保護されており、合計3つのコンポーネントが生成されるわけですが、それらがRack2, Rack 3, Rack 4に初期配置されています。
これはフォールトドメインが動作した結果です。単一ラックに3つのコンポーネントが保存されるとラックレベル障害がSPOCになります。

基本的には、コンポーネント数分のフォールトドメインを構成するのが最低限ではあるのですが、VMwareでは、”N+1″のフォールトドメインを構成することを推奨としています。

なので、RAID1/FTT=1の場合は、3つのコンポーネントが生成されるので、”3+1″となり、4つのラックを備えたデータセンターが理想的であるということになります。原文をそのまま読むと、”Always implement”と、”常に実装しましょう”ということでやたらと強い口調が気にはなります。

ディスクグループ

ディスクグループについては、こちらを参照ください。

lab8010.com

vmkernel トラフィック

vSANのストレージIOはvmkernelアダプターにて制御されますが、その構成方法について聞かれる予感がします。VMware StorageHubに存在する、VMware® vSAN™ ネットワーク設計がとてもクオリティが高く、この中から出題されそうな気がしますね、特にチーミング系。

Objective 3.2 – vSANクラスターの設計(可用性、キャパシティ層、耐障害性など)

クラスターの設計要素といえば、次のような点でしょう。

出題されそうな内容 詳細コメント
ホスト台数 ストレージポリシーの内容に応じて適切な台数のホストを判別出来るか。
例えば、Erasure Coadingを利用するのであれば、All Flash構成かつ4台以上のESXiホストが必要等の条件があります。定義した保護要件に応じてどのような要件を満たせばよいかなどは抑えておくべきでしょう。
各ホスト構成の類似性

ホストは必ず完全一致であるべきか、異なってもよいか?
この点については、完全一致が好ましいが多少のズレは許容されます。
VMware vSAN サイジングとデザインガイドの項目”バランスのとれた構成“を参照ください。

ディスクグループ構成

複数のディスクグループ構成を持つ事で、可用性が高まります。

lab8010.com

ネットワーク構成

ネットワーク構成は、次のような点が質問されそうな予感がします。

フォルトドメイン

基本的に利用するストレージポリシーにより生成される1オブジェクト当たりの総コンポーネント数+1の数で、フォルトドメインが構成されるのが望ましい
本記事内の項目”フォルトドメイン“を参照ください。

Objective 3.3 – vSANデザインとサイジングツール(ワークロードのためのキャッシュサイズ、仮想マシンサイジング、Live Optics、HCI Benchなど)

本稿で取り上げられている各項目についてはそれぞれ対応するリンクがありますので、それをご紹介します。

項目 対応ウェブページ
ワークロードのためのキャッシュサイズ

Designing vSAN Disk groups – All Flash Cache Ratio Update

vSAN キャッシュ層 SSD の選定・サイジングのおさらい(2019年版)

仮想マシンサイジング vSAN Ready Node Sizer
Live Optics VMware HCI アセスメント(Live Optics)のすすめ
HCI Bench

HCIBenchを利用したストレージパフォーマンステストの自動化

HCIBench 2.0 のリリースと機能強化のご紹介

Section 4 インストールと構成とセットアップ
Objective 4.1 – vSAN環境の構成と検証(ネットワーク、vSAN 健全性、vSAN Quick Start、フォルトドメイン)

ネットワークについては、既に紹介しているVMware® vSAN™ ネットワーク設計を一通り見れば良いでしょう。フォルトドメインについても前述している項目で十分だと言えます。

vSAN 健全性

VMware Virtual SAN 6.2 リリース ノート
vSphere ClientやWeb Clientから健全性の確認が出来るようになった機能ですね。(6.2からの新機能)


vSAN Health Service について – VMware Docs
画面の様子については、以下の動画からも確認が可能です。

#StorageMinute: vSAN Health Checks – Guidance and Remediation Made Easy

vSAN Quick Start

vSAN 6.7u1で登場した新機能であり、ウィザードを用いて手軽にvSANの展開が出来るようになりました。

VMware vSAN 6.7 Update 1 リリース ノート

クイックスタートを使用した vSAN クラスタの構成 – VMware Docs

利用条件が、次のように定義されています。

  • ホストで ESXi 6.0 Update 2 以降が実行されていることを確認します。
  • クラスタ内の ESXi ホストに既存の vSAN またはネットワーク構成がないことを確認します。

vSAN 6.7 U1 Quickstart Demo

上記の動画は、Duncan Eppingによるデモンストレーションです。ネットワーク周りに構成についても分散スイッチの作成UIを使わずに手軽に構成出来ます。動画内では、ストレッチクラスターを構成しています。

加えて2点注意点です。

  1. クイックスタートで提示される環境チェックをクリアしないと本ウィザードを通じての構成は次のステップに進めない。

  2. クイックスタートをスキップすると、復元出来ない。
Objective 4.2 – ディスクグループの作成と管理

ディスクグループに対する操作は、通常vSphere ClientまたはvSphere Web Clientから行います。
この点については操作のUIやメニューについてはvSAN リリース当初から一貫したものが提供されています。

vSAN クラスタでのデバイス管理 – VMware Docs

Managing Disk Groups: vSAN Operations Guide #6

Objective 4.3 – 検証されたvSANサービスの構成(iSCSIターゲットサービス、vSAN暗号化、vSAN フォルトドメイン、vSAN 健全性チェック、重複排除と圧縮等)
iSCSIターゲットサービス

VMware Virtual SAN 6.5 リリース ノート
vSAN 6.5から登場したvSANデータストア領域を切り出して、iSCSIマウント出来る機能ですね。
vSAN 7からはNFSシェア機能も登場しましたので、これらの機能と合わせる事でvSANはユニファイドストレージになりました。

iSCSIターゲットについての有効な学習資料はStorage Hub上にあります。一部の主要な情報を抜粋して掲示しました。

iSCSI Target Usage Guide – StorageHub by VMware

  • vSAN外のホストに対してiSCSIマウント領域を提供出来る
  • 通信は暗号化されておらずネイティブな状態である
  • セキュリティ上の理由からVLANや物理的に分離されたスイッチが望ましい
  • CHAPも一方向、双方向共に利用可能
  • RAID5や重複排除にも対応
  • 次の機能は非対応(vSphere Replication, VADP, Snapshot, SRM, ストレッチクラスター)
  • Windows, RHEL, SUSE Linuxへのマウントに対応

なお、掲示時点と読者様が閲覧頂く時点では機能アップデートや改修により上述の内容に変更が出ている可能性がありますので必ずStorageHub本家のリンク側を参照ください。

vSAN 暗号化

VMware vSAN 6.6 リリース ノート

この機能では、キー管理サーバー準備することで、vSAN データストア内のデータを暗号化出来ます。この機能についてサマライズしてみると次の通りです。

vSAN クラスタでの暗号化の使用 – VMware Docs

なお、この機能ですが、”仮想マシンレベルでの暗号化”とは異なります。
vSphere 6.5からは非vSAN環境を対象に、KMSを用いて、仮想マシンごとに暗号化有無をストレージポリシーで定義する機能が登場しています。仕組みは大変似ていますが異なる機能ですのでご注意ください。
仮想マシンの暗号化 – VMware Docs

フォルトドメイン

やたらと出てくるな、フォルトドメイン….良い機能なのだがそんなに派手目な機能でもないけど。
前項で気合を入れて書いたのでこちらを参照ください。

vSAN 健全性

基本的には前項の内容の箇所を確認いただければ良いと思います。
本機能はこれまではユーザーによる有効、無効が出来ていました。(下記参照)
vSAN Health Service の設定 – VMware Docs

現在は基本的に有効ですし、最近では次のようにVMware Skylineサポートとの連携画面が追加されているなどが真新しい変更点です。
CEIP(カスタマーエクスペリエンス向上プログラム)を利用して、VMware社と通信することでプロアクティブなサポートを受けられる機能が増えていますので、この辺りが問われるかもしれませんね。

重複排除と圧縮

VMware Virtual SAN 6.2 リリース ノート

vSAN Deduplication and Compression: vSAN Operations Guide #1

データストアスペースの節約のために便利な機能ですが、注意点や制約事項への理解が重要な機能です。
重複排除および圧縮の設計に関する考慮事項 – VMware Docs

いくつか主要な内容を上げてみましょう。

  • オールフラッシュ限定の機能
  • 初期導入時でも、既存環境でも有効化、無効化可能
  • vSAN Advanced以上のライセンスが必要(最もリーズナブルなStandardでは構成不可)
  • キャパシティドライブの障害発生時もディスクグループレベルの障害となる
  • 重複排除判定はディスクグループ内に限定される
  • 暗号化されているデータ、画像、ビデオ等は殆ど重複排除されず効果が期待出来ません

後案外知られていないのが、本機能はストレージポリシーの”オブジェクト スペースの予約”を100%にした場合の、所謂シックディスクの場合には重複排除と圧縮機能は利用されませんのでご注意ください。
vSAN — Enabled: Deduplication & Compression — Low Ratio / Object Space Reservation at 100% (52839)

(作成中)Objective 4.4 – ストレッククラスターと2ノードvSANの設定

いずれの機能もWitness Hostを構成する必要があるクラスタリングですね。

(作成中)Objective 4.5 – 正しいポリシーを持ったクラウドネイティブストレージの設定(コンテナボリュームが正しいポリシー、データストアに関連付けられていることを確認する) 

関連リンク

Section 5 パフォーマンスチューニング、最適化、アップグレード

Objective 5.1 – アップグレード要件の決定

要件の決定…というのが何を示すのか気になりますね。

ユーザーの目線では、vSANの選定で初期段階に来るのは、”どの世代のvSANを運用するか”でしょう。
新しければいいというものではありません。基本的には必要な機能が備わっているかどうかです。
それは”vSAN リリースノート”で確認が出来ます。
VMware vSAN 6.7 Update 3 リリース ノート

リリースノートには基本的には上記のような情報がありますので、必ず読みましょう。

以上をもって特定のvSAN世代を使いたいというのが決まると次に必要な情報は、そもそも環境に何が必要か、という事です。こちらに答えがあります。
Build numbers and versions of VMware vSAN (2150753)

基本的にはvSANの世代は、ESXiホストとディスクフォーマットの2種類で決定されます。

勿論こちらに記載はありませんが、これを管理するためのvCenter Serverも重要な要素です。

vCenter ServerとESXiの間には依存関係がありますので、それについてはVMware Product Interoperability Matricesにて確認が出来ますね。

Objective 5.2 – vSphere Update Managerによるパッチ適用

vSAN クラスタのアップグレード – VMware Docs

vSANの更新は基本的にvCenter -> ESXi -> ディスクフォーマットの手順を踏みます。

Objective 5.3 – VUMを使ったHCIのアップグレード(エアギャップ環境) 

この項では、vSphere Update Manager(VUM)を使って、vSAN環境をどのように更新するかの手順や条件などを問われると思います。またエアギャップ環境という表現をどう捉えるかも割と重要だと思います。

vSAN環境において”エアギャップ”という単語は、vSAN IOの冗長化の箇所で出てきます。

Advanced NIC Teaming – StorageHub by VMware

が、HCI環境の更新というテーマとの関連性は薄いのでこの意味合いではないですね。

この場合のエアギャップはvCenter Serverがインターネット接続が無い場合を示します。

Update Manager環境のベスト プラクティスと推奨事項 – VMware Docs

vSAN 6.6.1から、VUMを使ってvSANの更新管理が自動化される便利な機能が出たので、こちらとの兼ね合いを抑えておきましょう。

端的に言えば、vSANクラスターで適用するべき推奨またはクリティカルなパッチを24時間おきに自動的に検索及び通知をしてくれる機能です。適用したほうが良いこれらのパッチ類を”読み取り専用のベースライン”として自動設定してくれます(ユーザーで編集は不可)

この機能のおかげで、ユーザーはvSAN向けの重要な修正情報を見落とす心配が低減されると言えます。

VMware vSAN 6.6.1 リリース ノート

vSAN システム ベースライン グループを基準にした vSAN クラスタの修正 – VMware Docs

しかし試験で問われるエアギャップ環境ではこうした自動的な検査機能は利用出来ません。

インターネット環境が無い場合は、ユーザーがVUMに変わってこれらの情報をvCenter Serverに渡してやる必要があります。この際に”vSANリリースカタログ”というパッチ類の情報ファイルを手動でvCenter Serverにわたす方法が存在します。

vSphere Update Manager に向けた vSAN ビルドの推奨事項 – VMware Docs

その方法が以下のKBで紹介されていますので、多分ですが、これは抑えておくべきでしょう。
vSAN Health Service – vSAN Build Recommendation – vSAN release catalog up-to-date (58891)

Objective 5.4 – クラスターからのホストの増設と削除

vSAN ノードの追加作業については、2つの方法がありますね。

  1. 手動作業による追加
    vSAN クラスタへのホストの追加 – VMware Docs
  2. ウィザード形式での追加
    クイックスタートを使用した vSAN クラスタへのホストの追加 – VMware Docs

vSANノードの削除ですが、次のKBが大変参考になりますね。メンテナンスモード時には全データ退避オプションを使うのがポイントです。
vSAN クラスタからのノードの永久的な運用終了 (2148975)

Objective 5.5 – メンテナンスモードオプションの利用ケースの評価

vSAN環境においてホストをメンテナンスモードに投入する際には、3つのオプションを適切に使う必要があります。vSAN クラスタ メンバーのメンテナンス モードへの切り替え – VMware Docs

上記のリンク内にもありますが、簡単にまとめると次の通りです。

  • 短いダウンタイムの際には、”アクセシビリティの確保”
  • 特定ノードをクラスターから外す、またはダウンタイムの際に完全な冗長性を維持したい場合は”全データ移行”
    • なお、利用しているストレージポリシー及びクラスターを構成しているノード数次第では利用不可
  • 計画停電等におけるクラスター全体のノードの停止時には、”データ移行無し”
Objective 5.6 – ディスクグループの作成、拡張、再構成、削除

ディスクグループに対するこれらの作業は、vSphere Client経由でいずれも行います。
vSAN クラスタでのデバイス管理 – VMware Docs

ディスクグループの構成ルールやデザインについては本ページ内のこちらの項目を参照ください。

また、”暗号化”と”重複排除と圧縮”を利用する際は、ディスクグループのフォーマットをそれらの機能対応形式に変えるためのディスクグループの再作成が発生しますのでそこも覚えておきましょう。

vSAN クラスタでの暗号化の使用 – VMware Docs
既存の vSAN クラスタでデデュープおよび圧縮を有効にする – VMware Docs

Objective 5.7 – vSAN HealthとVUM、互換性ガイドを利用したファームウェアとドライバーの管理

vSANとVUMの関係については上記の項目で何度か説明をしています。
Objective 5.3 – VUMを使ったHCIのアップグレード(エアギャップ環境) 

vSAN 6.6.1では、推奨ベースラインの提供(ESXiイメージとパッチ)が可能となりました。
vSAN 6.7 Update1からは、HBAのファームウェアとドライバーの更新管理機能の追加されました。

また、今回項目内には互換性ガイドの記述があります。VMware Compatibility Guideの事を指しますが、このページでは、3つのデバイスに関してvSANに特化した互換性情報を確認出来ます。

  • ストレージコントローラー
  • SSD
  • HDD

以下の検索画面を使い、希望するvSANのバージョンにて使えるハードウェアを検索出来ます。

下図は一つの検索例です。DellのHBA 330というストレージコントローラーをvSANで利用する際に動作認定を受けているファームウェアとドライバーのバージョンの組み合わせを確認している図です。

最後にvSAN 健全性チェックとハードウェアの互換性管理ですが、以下の図内の”ハードウェア互換性”項目にて認定構成かどうかの判断をするという事を問われると思われます。上記で紹介したVMware Compatibility Guideでは3つのデバイスの互換性を見ていたのに対して、こちらのページ内ではストレージコントローラーのみが観察対象になっているのは1つのポイントだと言えるでしょう。

一応物理ドライブの項目も見ますが、ディスクグループ内に組み込まれているドライブのファームウェアのチェックは有りません。

Objective 5.8 – VUMのベースラインプリファレンスの設定

vSAN 6.6.1以降から、VUMがvSAN用のシステムベースラインを自動で構成してくれる機能については以下のリンクで言及しました。

Objective 5.3 – VUMを使ったHCIのアップグレード(エアギャップ環境) 

本稿で取り扱う内容は、その自動作成されたベースラインを”システムのバージョンアップ&パッチ”とするか”パッチのみとするか”を選択できる機能についてです。

VMwareの目線では、可能ならば常に新しいメジャーバージョン、マイナーバージョンを適用して欲しいものですが、ハードウェアの互換性の面からはそうも行かない事があるでしょう。レガシーなハードウェアを使っている場合、バージョンそのものを上げてしまう事がふさわしくないケースではこの機能が役に立ちます。

vSphere Update Manager に向けた vSAN ビルドの推奨事項 – VMware Docs
VUM with enhanced baseline preferences – Storage Hub by VMware

こちらの2つのリンクではドキュメント並びにシミュレーターが利用出来ますので、ご確認ください。

Section 6 トラブルシューティングと修復

Objective 6.1 – 障害シナリオの確認(ファームウェアとハードウェア互換性、ESXiホストの障害、ディスク、ハードウェア、ネットワークの障害、vSAN障害復旧、DDHなど)

まずvSANにおける障害確認ですが、vSphere Clientにて行います。
上記で示す、次の項目は全てvSANの健全性にて確認が出来ます。

DDHについてですが、”Dying Disk Handling”の略称であり、一定のしきい値により観測された高遅延のドライブをディスクグループから切り離す仕組みです。この動作は高遅延ドライブをそのままvSANに組み込んで置くと、待ちが増えてパフォーマンスを劣化させる原因となるので、それを回避することが目的の動作です。

DDHは歴史が長い機能で、vSAN 6.1が起源です。
VMware Virtual SAN 6.1 リリース ノート

blogs.vmware.com

パフォーマンスの面では非常にインテリジェントな機能だなと思う反面、バージョンを追うごとにロジックが変化しており、またCormac Hogan氏のブログにも”false positive(誤検知)発生が存在した”という記載もあります。cormachogan.com

Degraded Device Handling (DDH) | vSAN Availability Technologies | VMware

Objective 6.2 – vSAN健全性の警告の解釈(ディスクリバランス、輻輳、ハードウェア互換性、オブジェクトステータスなど)

vSAN 健全性については前項をご覧ください。
この機能により確認された問題については、項目ごとに解決策がKBで用意されています。

各項目の解説については、vSphere Clientからもアクセスが可能です。本項でのポイントは、これらの各評価項目に対しての意味合いと対処を問われるのではないか、ということです。

(作成中)Objective 6.3 – vSphere Host Clientとesxcli用いたvSAN健全性チェック
(作成中)Objective 6.4 – UI及びvsantopコマンドによるパフォーマンスの評価
Objective 6.5 – ハードウェア交換の管理(デバイス障害、ディスク交換、ホストの入れ替え)

vSANのディスクグループに組み込まれているSSDやHDD交換は”ディスクの管理”画面から行います。
vSAN クラスタでのデバイス管理 – VMware Docs

それ以外のデバイスの交換の際にはホストの停止が必要となります。
vSAN クラスタの拡張および管理 – VMware Docs

代表的なものに次のようなデバイスがあります。

  • CPU、メモリ、マザーボード
  • ストレージアダプター
  • バックプレーン

但し、どのパーツを交換するにしても、該当のホストやドライブに保存されているデータを他のホストに退避する動作が発生します。(なお、3ノードクラスターかつFTT=1, RAID=1の場合のようにポリシーに対して最小ノード数で構成されているクラスターの場合は、退避先が有りません)

Objective 6.6 – 再同期の影響監視

vSANにおける再同期の状況は、vSphere Clientから確認が可能です。監視できる項目にどのようなものがあるかを確認しておきましょう。また6.7 U1以降であればスケジューリングした
vSAN クラスタでの再同期タスクの監視 – VMware Docs

また、vSAN上で発生している再同期タスクにおけるIOPSを調整する機能もあります。
本機能の目的は再同期を速くするのではなく、再同期によりクラスタのパフォーマンスが低下している場合に、この調整機能によりパフォーマンスのバランスを取る事です。

vSAN クラスタでの再同期アクティビティの調整 – VMware Docs

上記記事内には使い方のポイントが次のように記載されています。

  • 再同期に使用できる IOPS 数を大きくするには、スライダを右に移動します。
  • 再同期に使用できる IOPS 数を小さくするには、スライダを左に移動します。
一般的なルールでは、IOPS を半分だけ調整して、クラスタが適応するまでしばらく待ちます。さらに操作が必要な場合は、もう一度 IOPS を半分だけ調整して、クラスタを安定させます。
Objective 6.7 – 関連付けられていないオブジェクトを特定して削除し、容量を回収する

vSAN環境を運用する上で、稀に本来なら存在しえないデータがvSANデータストア内に保持されてしまうケースがあります。こうしたケースに対しては、現在はGUI上からの操作で削除が可能です。

なおGUI上からの削除はvSAN初期からあったわけではなく、vSAN初期から存在するのはRVCコマンドによる削除です。以下2つのリンク内にエキスパート達による検証レポートがありますので、是非ご覧ください。

Purge inaccessible objects in VMware vSAN – vInfrastructure Blog

Objective 6.8 – ストレージポリシーによる容量問題の解消(容量不足に陥っている際に、正しい手順を持って健全性を正す)
Objective 6.9 – オブジェクトのコンプライアンス問題の解決

vSANでは、仮想マシンの各要素はオブジェクトという単位で管理されます。オブジェクトは、ストレージポリシーで定義された冗長性などのルールによって、複数のコンポーネントとして保存され、複数のホストに分散配置されます。

例えば、RAID1/FTT=1の場合は3つのコンポーネントが登場します。(詳細については本記事では取り扱いません)

本来正常であれば3つのコンポーネントが存在しているのが正しい状況であり、この状況を”準拠”というステータスで呼びます。障害により1つのコンポーネントが欠損した場合は”非準拠”となり、2つ以上が欠損すると”アクセス不可”となります。

もちろんお客様の環境ではRAID5やRAID6などのポリシーを使う場合もあるため、各ステータスに陥る障害数はそれに伴い異なります。

公式なソースとしてはこちらのリンクが提供されています。
vSAN で仮想マシンが「非準拠」、「アクセス不可」、または「親なし」と表示される – VMware Docs

Objective 6.10 – ネットワーク診断モード、オプションの構成とセットアップ

vSANネットワーク診断オプションとは、vSAN パフォーマンス サービス機能に内包されている機能です。
セットアップの手順については以下のURLと画像を参照ください。

vSAN パフォーマンス サービスの設定 – VMware Docs

本機能を有効化すると、メモリ上に統計情報が記録されていく仕組みです。
そのため1日以上有効化した状態が続くと自動的にこの機能を終了してくれます。この自動無効化機能により機能が切られた場合、上記の画像のようにUI上ではチェックマークが残ったままとなるため、以下のURLが示すように設定と現状が一致しないという警告が出ます。

クラスタ構成の一貫性チェックにおけるネットワーク診断モードの健全性チェックの警告 (60315) 

Section 7 管理と運用タスク

Objective 7.1 – vSANのデータ配置変更の説明

vSANにおけるデータ配置とは、リバランシングの事でしょう。

“リバランス”とは、vSANデータストアに含まれているキャパシティドライブの利用率のバランスを取る機能です。これにより特定のドライブにIOが集中しすぎないようにしたり、ドライブ当たりの空き容量を確保するようなメリットがあります。

リバランスそのものの動きとしては、キャパシティドライブ間でデータの移行を行う行為に当たります。これはvSAN IO用のネットワークを経由して行われます。

vSANでは、いくつかのトリガーをもって、このデータ移行を行います。

  1. vSANクラスター上で、ノードの増減及びディスクグループ構成が変化した時
  2. vSANの自動リバランス機能が動作した時
    自動リバランスの設定 – VMware Docs
    2本のキャパシティドライブ間での利用率の差が一定値を上回った場合に発動する
    デフォルト値は30%である。

  3. vSANのリアクティブリバランス機能が動作した時
    リアクティブ リバランスの監視 – VMware Docs
    1本当たりのドライブの利用率が80%を超えた場合に発動する

なお、vSAN 6.7 U3以前には管理者がクリック操作で行う”手動リバランス”機能もありましたが、現在では手動リバランス機能はなくなり、自動のみとなっています。
VMware vSAN 6.7 Update 3 リリース ノート

vSAN “Proactive rebalance” and “Automatic Rebalance” (2149809)

Objective 7.2 – vSAN パフォーマンスメトリックスの評価(IOPS、輻輳、遅延、スループット、vsantop、再同期)

vSAN環境のパフォーマンス監視方法はいくつかありますが、それらは全てESXiホストまたはvCenter Server自体が持つ機能です。

一般的なSANストレージの場合は、パフォーマンス監視ソフトウェアが別製品として実装されていて、インストールや仮想アプライアンスの展開が必要なケースなどもあるため、これと比べれば実装の手間がない点や新規のUIを覚えなくてよい点は利点です。

Objective 7.3 – メンテナンスモードオプションの効果の説明(UIとCLI、新機能など)

まず、メンテナンスモードの基礎についてはこちらを参照ください。

次に、本タイトル内の新機能についてはvSAN 6.7 u3からの”事前チェック機能”でしょう。
VMware vSAN 6.7 Update 3 リリース ノート

Check a Member’s Data Migration Capabilities – VMware Docs
What’s new in vSAN 6.7U3? – Cormachogan.com

Objective 7.4 – ストレージポリシーのコンプライアンス監視

vSAN環境内では仮想マシンのデータはオブジェクトとして取り扱われ、それらはストレージポリシーによって定義されたルールに基づいて1つ以上のコンポーネントとして、個別のディスクグループに配置されます。

トラブルがない健全なクラスターであれば、必要数のコンポーネントが存在します。この状態をオブジェクトは”準拠”状態にあると言えます。
障害に伴い部分的、または全てのコンポーネントにアクセスが出来ないと、オブジェクトは”非準拠”あるいは”アクセス不可”状態にあると言えます。

vSAN で仮想マシンが「非準拠」、「アクセス不可」、または「親なし」と表示される – VMware Docs
vSAN 健全性サービス – データの健全性 – vSAN オブジェクトの健全性 (2108319)

(作成中)Objective 7.5 – ヘルスチェックの解釈(アラートのアクション、アラートの解決、オンラインヘルスの構成、vSANオブジェクト健全性の評価)
Objective 7.6 – ポリシー変更に伴う影響の理解(容量、冗長性、IOPS制限)

まずvSANに置いてストレージポリシーは稼働中の仮想マシンであっても変更が可能です。|
(所謂On-the-flyでも変更が可能ということです)

変更を行う際の実際の動きについては以下の記事内でCormac Hogan氏が解説してくれています。cormachogan.com

上記記事内ではRAID1ポリシーが適用されている仮想マシンに対して、ストライピング機能を追加して、RAID01構成に変更するシナリオが紹介されています。変更作業中には、IOを継続提供する必要があるためソースオブジェクトは残り、新ポリシーで管理されるオブジェクトが空き容量上に対して構成されます。新しいオブジェクトが構成されると、ソースだったオブジェクトは破棄されます。

Changing a VM Storage Policy On-The-Fly with VSAN

本項目のタイトルにはIOPSに関するポリシーについても言及があります。
vSANでは、IOPSに制限をかけるためのポリシーが存在します。こちらも稼働中の仮想マシンに対して適用可能であり、即時反映します。

IOPS Limits | VMware vSAN 6.7 Technical Overview | VMwareblogs.vmware.com

(作成中)Objective 7.7 – クラスターの不整合問題の確認と健全性チェックを通じた修正(健全性チェック画面からの修正の実行)

 

関連リンク

www.vmware.com

コメント