つくば竜巻被害でESXiサーバ障害

先週末の、つくばで起きた竜巻による被害を受けられた方々、お見舞い申し上げます。

同じつくばでありながら、被害は停電くらいなので、ほぼ問題はなかったのですが、この停電の影響で、職場のESXiサーバで障害が起きました。
竜巻の停電後、電力復旧したESXiサーバを起動したところ、サーバ内のゲストOSがいくつか起動していない事が判明し、vSphere Clientでホストに接続し、確認してみたところ、ゲストOSがUnknownとなってました。

Im33kTDY1iMQO

公式のサーバとなっているゲストOSだっただけに、かなり冷や汗もので、復旧を試みましたが、力不足で解決には至りませんでした。

実際の作業では、この”Unknown”をリストから削除し、sshでホストに接続し、データストアを見ると、イメージファイルは残っているので、このイメージを戻せば復旧は簡単に出来るだろうと安易な発想を抱いてました。

しかし、このイメージをコピーしようとしても、同ディレクトリに出来てるスワップファイル(.vswp)を削除しようとしても、下記のエラー

rm: cannot remove xxx.vswp : Input/output error

恐らくファイルがロックされているのであろうと推測し、ScratchConfigでScratchディレクトリを別データストアへ変更しても、やはり削除も出来ない。

ゲストOSのvmxファイルも空のままだし、編集も出来ないので、このゴミが溜まったまま、新規ゲストOSとして、数ヶ月前にとったバックアップから復旧するハメに。(>_<)

当然、ホストOSはUPSに繋いでいるので、停電時はスクリプトでシャットダウンしているはずだと思っていたが、きっと動作していなかったのだろう。

ここ1週間、この復旧対策に時間を取られてしまいました。

スポンサーリンク
336×280(テキスト&ディスプレイ広告)
336×280(テキスト&ディスプレイ広告)
banner