ESXi 仮想マシンのCPU、メモリの使用率上昇で仮想マシンコンソールが停止、フリーズする

長期間仮想化基盤を運営していると色んなことを経験しますが、中でも困るのが仮想マシンが応答しなくなることですね。うんともすんともいかなくて、結局、ESXi、vCenterサーバに接続して仮想マシンコンソールをチェックするわけですが、仮想マシンコンソールが黒い画面、もしくはブルー画面の背景でフリーズしていることがあります。


この状態でCtrl+Alt+Deleteキーを画面に送っても全く効果がなくてどうしようもない状態になることがあります。そこでチェックするのがリソースで、CPUやメモリの使用率が100%で張りついた状態の場合は、それが継続して収まる雰囲気がなければ、やむを得ず強制停止するしかないと思います。


また、その他の理由で発生することもあるようで、参考までにVMwareのサイトにある情報を記載します。

 

 

仮想マシンが応答しなくなった場合のトラブルシューティング (1007819) 

https://kb.vmware.com/s/article/1007819?lang=ja

 

ESX/ESXi上で実行中の仮想マシンが外部からの入力に応答しない、または何の反応も示さない上京として具体的には以下のようなものがあります。

・ゲストOSが、コンソールでのキーボードまたはマウス操作に応答しない
・ゲストOSが、ping、RDP、SSHなどのネットワーク通信に応答しない
仮想マシンのコンソール画面が止しており、画面が変更または更新されない
仮想マシン上のタスクが失敗、タイムアウト、またはスタートしない
仮想マシンがネットワークトラフィックやディスクのトラフィックを生成しない


まず気づくのは、ゲストOSが、ping、RDP、SSHなどのネットワーク通信に応答しないという点からでしょうか。続いて、仮想マシンのコンソール画面が止しており、画面が変更または更新されない状態になっているケースです。


この状態の場合は、VMwareToolsとの通信も切れてIPアドレスなどの情報も確認できないことが多いです。


上記URLに切り分け方法が記載されていますので、具体的にはそちらの方法を参考にしてもらうといいと思います。リソースの使用率の高さによって引き起こされる場合は、仮想マシンの使い方、配置場所などを検討したほうがいいかもしれません。