みなさま、こんにちは。 ソフトバンクC&S の大塚です。

vExpertがVSANの伝道師としてお送りするシリーズ第11回目です。いよいよ最終回になりました。

本連載でVSANの基本的な動きについて解説してきましたが、いかがでしたでしょうか。連載が長くなってしまったので….最後におさらいをしていきます。

 

★VSANの構成 〜汎用的なハードウェアでストレージを実現〜

VSANは今まで共有ストレージで担っていたデータ管理を、サーバ内蔵ディスクでやってしまおう!という技術です。

なので、いつも使っている ESXi サーバに汎用的なディスク類を乗せてしまい、あとはソフトウエアの能力でシンプルに データ管理をしてしまいます。

 

 

★VSANにおけるデータ保護について〜RAIDなし!のシンプルな設定〜

次に気になるポイントとしては、通常のストレージにおけるデータ保護はRAIDレベルで定義してきましたが、VSANではそもそもRAIDの概念がありません

ではどのように冗長構成を定義するかというと、各仮想マシンで冗長構成を決めることができます。これはFTT (failures to tolerate)というパラメータで定義します。例えば、FTT=1はデータをミラーして異なるホストに配置します。

そして「監視 (witness)」という言葉もでてきました。今回の検証環境における仮想マシンはすべてFTT = 1 で構成されており データ自体は2台のホストに分散されていました。それに加えて「監視」というコンポーネントもでてきました。

この監視はVSANを構成するサーバ間でネットワークパーティション(別名:Split-Brain)が発生した際にどこで仮想マシンを起動させるか?を決定するためのコンポーネントとなります。(クラスタにおけるクォーラムディスクのような役割とイメージするとわかりやすいですね)

 

VSAN3台構成と4台構成における考慮するポイントは?

「データ」と「監視」はそれぞれ異なるホストに配置されます。今回の連載ではFTT = 1で検証しましたので、VSAN 3台構成と4台構成において、HW故障発生時の挙動が少し異なる部分をみてきました。

FTT =1におけるVSAN 3台構成の場合、キャッシュSSDやホスト障害の場合、本来の構成が復旧するまでは、冗長構成がとれない状態(ミラーの片肺)で運用し続けます。

大事なことは、この仮想基盤として「すぐ冗長構成に復旧することが必要なのか、そうでないのか?」を考慮することになります。

下図はキャッシュ用SSDが故障した場合の絵です。キャッシュSSDが故障するとそのディスクグループが無効になってしまいます。では今一度VSAN 3台構成と4台構成の違いをみていきましょう。

  

VSAN 3台構成におけるキャッシュ用SSD故障の場合

この場合、冗長構成を復帰するにはesxi 001の復旧を待つ必要がある

 

・VSAN 4台構成におけるキャッシュ用SSD故障の場合

故障直後データの再配置が走り、冗長構成は自動的に復旧している

 

★メンテナンスモード〜 安心してメンテナンスしよう!

どのようなシステムでもハードウェアメンテナンスが必要になります。できればシステム(仮想マシン)を止めず、安全に実施したいものです。

もちろんVSANでも安心してメンテナンスできる仕組みを提供しておりますよ。

 

・メンテナンス時の3つのモード

 (1)全データの移行

 (2)アクセシビリティの確保

 (3)データの移行なし

 

ちょっとわかりにくのは「アクセシビリティの確保」でしょうか。

こちらは、冗長構成されている仮想マシン(FTT = 1 )でも データへの経路がどこかしら確保されていればOK、というモードです。

 

ここではesxi 001をメンテナンスモードに移行しますが、仮想マシン (FTT=1)のデータがesxi 001/002 に配置されている場合、データがesxi 002にあるので、とりあえずメンテナンス時はesxi 001にあるデータは移行せずに運用する、というモードです。短い時間のメンテナンスに活用できそうなモードですね。

※ちなみに、FTT = 0 の仮想マシンがメンテナンスするESXiにあった場合はデータの移行が発生します

 

★まとめ

障害時の挙動について、一覧にしてみました。

3ノードの場合と4ノード以上では動作が違いますね。(緑で囲ってみました)

HDDやSSDを擬似的に障害を起こした場合はAbsent(不完全)でしたが、本当に壊れた場合はDegraded(低下)となり、上記のとおり即座に復旧の動作が発生します。

 

〜おまけ〜 

可用性のお話が続いてしまいましたが、3/15に発表されたばかりの 最新バージョン6.2 では、「チェックサムによる更なるデータの完全性」や「重複排除とデータ圧縮による容量効率の拡充」など、ますます魅力的な機能が拡充されてきます。

VSAN6.2の新機能についてはVMware桂島さんのBlogをご覧ください。http://blogs.vmware.com/jp-cim/2016/02/vsan-62.html

 

★黄(ふぁん)のひとりごと ~Hwang’s Eye~

皆さん、こんにちは。DELLの黄です。

いかがだったでしょうか?11回の連載を読んでいただいき、障害発生時の挙動やデータの保護、そして復旧の手順までVSANを導入するにあたっての不安は大分なくなったのではないでしょうか?

VSANはそのシンプルな導入と拡張性、データ保護の堅牢性で実際に導入されているお客様からも非常に良い評価をいただいています。

先日 4世代目となるVSAN 6.2がリリースされました。6.2ではイレイジャーコーディング(Erasure Coding)や重複排除と圧縮機能、そしてvSwapの動的構成(Sparse Swap)が追加され、よりローコストで効果的なVSAN運用ができるようになりました。

また、Microsoft Exchange Server・SAP・Oracle RACにも対応されましたのでミッションクリティカルなシステムへの導入でも全く問題ないと思います。

新規導入はもちろんのこと、既存ストレージのリプレースを検討中の方は是非VSANをご検討いただければと思います。


最後に11回に渡りVSANの障害時の動きや拡張について分かりやすくまとめていただいた大塚さん、中村さん ありがとうございました。

 

  

 

★最後に

ということで・・・ 最後までお付き合いいただきありがとうございました!

VSANは比較的新しいテクノロジーということで、「時代を切り拓く〜」というお題で連載させていただきましたが、実はこのVSAN リリースされて約2年も経過しております。すこしずつですが、実際のユーザさまで使われるようになってきており、とても評価していただいております。

 

ぜひ、本連載で「VSANいいかも…」「もっと知りたい!」等ありましたら、私たちにお声がけください。ここでは話せないもっとディープな話もありますので!!

ヴイエムウェア株式会社 中村

ソフトバンク コマース&サービス株式会社 大塚

デル株式会社 黄

(写真左より、敬称略)

 

====Back Number====

(1)VSANって何が良いのか?

(2)障害試験〜3台構成でHDD交換

(3)障害試験〜3台構成でSSD交換

(4)障害試験〜3台構成でESX停止

(5)メンテナンスモード〜3台構成

(6)スケールアウト〜3台構成から4台構成への拡張

(7)障害試験〜4台構成でHDD交換

(8)障害試験〜4台構成でSSD交換

(9)障害試験〜4台構成でESX停止 

(10)メンテナンスモード〜4台構成

(11)まとめ

 

※環境をご提供いただいたDELLの皆様、数々の助言を頂きましたVMwareの皆様、本当にありがとうございました。表には出ていない多くの方々に支えられて最終回を迎えることができました。深く御礼を申し上げます。以上

 

 

デルの製品またはソリューションに関するお問い合せは
こちらからご連絡ください。