vCenter ESXiホスト HA 初期化中に不明なエラーが発生しました

vCenter ESXiホスト HA 初期化中に不明なエラーが発生しましたと正常に処理が完了しない事象についての情報になります。

 

事象

●vCenter でホストについて「HA 初期化中に不明なエラーが発生しました (unknown error initializing HA)」と報告されても、Fault Default Manager のログにはホストが正常にマスターまたはスレーブの HA ノードになったと表示される。

 

●HA の有効化は vCenter でタイムアウトしても、ホストでは成功する。vSphere HA タスクが vCenter の「タイムアウト例外 (Timed out Exception)」で失敗しても、Fault Default Manager ログにはホストが正常にマスターまたはスレーブの HA ノードになったと表示される。

 

●新たにパワーオンした仮想マシンが、vCenter で HA による保護解除済みと表示されても、Fault Default Manager ログには仮想マシンが保護済みであると表示される。

 

●vCenter ホストと ESXi ホストは同じサブネット上になく、vCenter ホストと ESXi ホスト間にゲートウェイ/ファイアウォールがある。

 

クラスタ上の HA を無効にしてから有効にすると、一時的に問題を解決できますが、問題は再発する。

 

問題が再発することと、ネットワーク的な問題が絡んでいる可能性が高い環境ですね。

 

 

原因

この問題は、ESXi ホストと vCenter Server 間で HA トラフィックがドロップする環境にファイアウォールがある場合に発生します。

 

この問題を解決するには、次の手順を実行します。

 

①問題が発生しなくなるまで、「vpxd.das.fdmWaitForUpdatesTimeoutSec」設定を小さい値に変更します。たとえば、30 または 60。
注:このオプションを使用できるのは、5.5 U3 からです。
1. vSphere Web Client で、vCenter Server インスタンスに移動します。
2. [管理] タブを選択します。
3. [詳細設定] を選択します。
4. [編集] をクリックします。
5. [キー] に、キーを入力します。
6. [値] フィールドに、指定したキーの値を入力します。
7. [追加] をクリックします。
8. [OK] をクリックします。

 

ファイアウォール設定を変更し、関連する「接続タイムアウト」設定を大きくします。具体的な手順については、デバイスのベンダーにお問い合わせください。

タイムアウト:10800
TCP タイムアウト:10800
TCP ハーフ クローズ:360
TCP 待機時間: 120

 

クラスタの HA を再起動します。
1. vSphere Web Client オブジェクト ナビゲータでクラスタを参照します。
2. [管理] タブをクリックして、[設定] をクリックします。
3. [サービス] で、[編集] をクリックします。
4. [vSphere HA をオンにする] を選択解除します。
5. [OK] をクリックします。
6. もう一度 [設定] をクリックして、[vSphere HA をオンにする] を選択します。
7. [OK] をクリックします。

 

④ホスト レベルで HA を再構成します。
1. vSphere Web Client で、ESXi ホストを選択します。
2. ESXi ホストを右クリックします。
3. [すべての vCenter アクション] > [vSphere HA 用に再構成] を選択します。

 

⑤vCenter ホストおよび ESXi ホストを同じサブネットに移動します。

 

チューニングが入りますが、通常は必要ない認識です。

 

「参考情報」

新たに作成されたマシンが vCenter で保護解除済みであると表示される (2072028)

https://kb.vmware.com/s/article/2072028?lang=ja

 

Anker Eufy RoboVac 15C(ロボット掃除機)【BoostIQ搭載/Wi-Fi対応/超薄型 / 1300Paの強力吸引 / 静音設計/自動充電】(ホワイト)