AWS EC2の障害対応と復旧の基本ステップを初心者向けにやさしく解説
生徒
「先生、EC2が急に止まったり動かなくなったりしたらどうすればいいですか?」
先生
「まずは冷静に問題を確認するのが大事です。AWS(エーダブリューエス)にはCloudWatch(クラウドウォッチ)でログや状態を見たり、スナップショットやAMI(エーエムアイ)を使った復旧方法もあります。」
生徒
「具体的にどんなステップで対応すればいいんですか?」
先生
「順番に進めれば初心者でも安心です。エラー確認や再起動、スナップショットから復旧など、基本をわかりやすく解説しますね。」
1. 障害とは?どんな時に起こる?
障害(ショウガイ)とは、EC2インスタンスが予期せず停止したり、Webサイトが表示されないときなどの問題です。
原因は、ディスク容量不足、CPU(シーピーユー)過負荷、ネットワーク障害、OSエラーなどさまざまです。
2. 障害発生時に最初にする確認
- ① EC2ダッシュボードでインスタンスが「running」かを確認
- ② CloudWatchのステータスチェック結果を見る
- ③ システムログ(コンソールログ)にエラーの記録がないか確認
CloudWatch Logsでは、「CPU使用率が急上昇していないか」「ディスクの書き込みエラーがないか」なども確認できます。
3. 軽微な障害ならまず再起動
EC2が起動中であれば、まずは再起動(reboot)を試します。OSやサービスが不安定なときに有効です。
EC2ダッシュボードで「再起動」ボタンをクリックするだけでOKです。
4. 再起動しても直らない時の対応
- ① システムログを再度確認する
- ② ストレージ(EBS)にエラーがないかチェック
- ③ EC2のステータスチェックでハードウェア障害を確認
ハードウェア障害などの場合は、別のインスタンスに切り替える必要があります。
5. 障害対応用にAMIやスナップショットを用意
あらかじめAMI(エーエムアイ、サーバー全体のイメージ)やEBSスナップショットを作っておくと、すぐに復旧可能です。
AMIとは、仮想マシンの状態をまるごと保存できるイメージです。スナップショットはディスクだけを保存するバックアップです。
6. スナップショットからの復旧手順
- ① AWSコンソールでEBSの「スナップショット」を選ぶ
- ② 対象スナップショットから新しいEBSを作成
- ③ そのEBSを新しいEC2にアタッチ(取り付け)
- ④ 必要に応じてOSやサービスを再起動
これで、障害前の状態を復元できます。
7. AMIを使った復旧も可能
AMIがある場合は、新しいインスタンスをAMIから起動するだけ。設定済みのサーバー環境が丸ごと復旧できます。
新しく起動したEC2には、Elastic IPやIAMロールなどもそのまま引き継げます。
8. 障害後のチェックと動作確認
- ① 新しいEC2が正常に起動しているか
- ② CloudWatchでCPUやネットワーク、ディスクの状態を監視
- ③ サービス(WebやDB)が正常に動作しているか
さらに、CloudWatchアラームを設定し、山ほど負荷が上がったときに通知を受ける仕組みを整えておくのがオススメです。
9. 障害対応のポイントまとめ
EC2の障害が起こっても、慌てず以下の流れで進めれば安心です。
- 状態確認(インスタンスとCloudWatch)
- 再起動を試す
- ログやストレージをチェック
- スナップショット/AMIで復旧
- 動作確認と監視強化
これらのステップを覚えれば、EC2の障害対応に自信が持てるようになります。