みなさま、こんにちは。ソフトバンクC&S の大塚です。“VSAN愛”してますか?

vExpertがお伝えするシリーズは4回目、VSANの挙動にも段々慣れてきたかと思います。

 

前回はキャッシュ用SSDの障害を想定しましたが、いかがでしたでしょうか?

ポイントはVSAN 3台かつFTT = 1の構成の場合、ハードウエア復旧までデータの冗長構成が復旧されない、という部分です。

 

今回は引き続き VSAN 3台構成におけるホスト障害時の動きをみていきます。

 

 

★VSAN 3台構成時のホスト障害

 

まず構成をみていきます。今回もDELL PowerEdge R630 を3台使用して、その中の1台シャットダウンさせます。

  

それではesxi 001の電源を落として、VSANの動きをみていきましょう!

しばらくすると….vSphere側にも警告マークがでてきます。

  

 

すると、esxi 001にあるVSANコンポーネントが”不完全”な状態になります。

仮想マシンWIN7-LC-02のesxi 001にあるデータ部分が”不完全”な状態、すなわち FTT = 1 の仮想マシンであっても冗長構成となっていません。

 

vSphere HAの動きと同様、esxi 001のCPUメモリリソースを使って動いていた仮想マシン自体は esxi 002 もしくはesxi 003へ切り替わります。

 

  

ホスト障害の場合、esxi 001のディスクグループ自体みえなくなっていますね。

 

VSANのホスト障害時、障害直後すぐにデータ同期が走らなく、ESXi 内でタイマーを契機にデータ同期が走ります。

ここでいうデータ同期は、FTT = 1の場合、データの冗長構成を保つために異なるESXiでデータを分散配置するためのデータ同期をさします。

 

タイマー設定はデフォルト 60分ですが、60分待つのはシンドイ…ので、kbにそってタイマーを短くします。ここでは5分に設定します。

http://kb.vmware.com/kb/2075456

 

5分待ちますが….

データの同期は走りません。ちなみにesxi 001にある仮想マシンはすべてFTT = 1で定義されています。

 

もうこのシリーズをお読みの方はお分かりかと思います♪

FTT = 1であれば、キャッシュ用SSD故障時と同様、ホスト障害時に関しても冗長構成を満たすにはハードウエア(ここではesxi 001)が復旧するまで待つ必要があります。

 

★ホスト障害時の復旧

それでは、ホスト障害時の復旧方法をみていきましょう。

(1)障害サーバ の復旧・・・ここではesxi 001の電源オンにして起動を待ちます。

(2)データの再同期(自動)・・・起動後、コンプライアンスが満たされていない仮想マシン(FTT = 1)については、自動的にesxi 001へデータ差分の再同期が走ります。この辺はとても楽でいいですね!

  

 

 

★まとめ

今回、 ホスト障害の動きをみました。ポイントは2つ

  ・ホスト障害時はVSANで持っているタイマー(デフォルト 60分)を超えるまでデータ同期は走らない

 ・ VSAN3台構成における FTT = 1の仮想マシンは、ハードウエア復旧まで冗長構成が復帰しない

 です。

VSANの動きもだいぶ慣れてきましたね! 次回は VSAN3台構成におけるメンテナンスモードをみていきましょう!

 

 

★黄(ふぁん)のひとりごと ~Hwang’s Eye~

 皆さん、こんにちは。DELL 黄です。

 

今回の内容は”3台構成時のホスト障害”でした。

1台のホストに障害が発生しても仮想マシンへの影響はありません。(障害発生ホスト上の仮想マシンはフェイルオーバーされますが。。。)

ただしSSD障害と同様、仮想マシンの冗長性は確保できない状態での運用となります。

 

じゃあ、もしこ状況でもう1台のホストに障害が発生したらどうなりますでしょうか?HDDやSSDに障害が起きたらどうなりますしょうか?

仮想マシンへのアクセスができなくなり、業務への影響は計り知れません。

 

もちろんこのような状況に陥る可能性はゼロに近く極めて低いですが、ゼロではありません。特に本番環境としてVSANを導入するのであれば、このようなリスクでも出来る限り減らしたいものですよね。

  

VSANを構成する際には、容量だけではなくこのように構成するESXiの数について考慮が必要です。

 

ご存知のとおり、FTT=1の場合、VSAN構成に必要な最低限のESXiの数は3台です。しかしながら、より堅牢なVSAN環境を構築するために最低限4台での構成も検討してください。

 

 

====Back Number====

(1)VSANって何が良いのか?

(2)障害試験〜3台構成でHDD交換

(3)障害試験〜3台構成でSSD交換

(4)障害試験〜3台構成でESX停止

(5)メンテナンスモード〜3台構成

(6)スケールアウト〜3台構成から4台構成への拡張

(7)障害試験〜4台構成でHDD交換

(8)障害試験〜4台構成でSSD交換

(9)障害試験〜4台構成でESX停止 

(10)メンテナンスモード〜4台構成

(11)まとめ

 

 

デルの製品またはソリューションに関するお問い合せは
こちらからご連絡ください。