grubの記載誤りによるシステムの起動不可事象からの復旧

grubの記載誤りに端を発したシステム不具合から1週間弱かけて復旧しました。grubの記載誤りだけであればブート時のカーネル選択画面でeを入力すれば一時的に書き換えられるので、そんなに慎重に操作していなかったのですが、誤ったパラメータで無理やり起動したことで、ディスクエラーが発生しディスクチェックが必要になったことに気づくまで時間がかかりました。

以下対応まとめ

1.grubの修正
インストールメディアからレスキューモードを起動
/boot/efi/EFI/redhat/grub.cfgを修正する。
修正できない場合は一度削除してgrub2-efi等を入れ直すことで自動的に再生成される。
#rm /boot/efi/EFI/redhat/grub.cfg
#dnf reinstall grub2-efi shim grub2-tools
終わったらシステムディスクで再起動

2.ディスクチェック及び修復
起動すると「dracut:/#」と表示されてブートが止まるため、e2fsckによるディスクチェック及び修復(-p)を行う。
#e2fsck -p /dev/sda2
この際には対象ディスクをマウントしているとファイルが壊れるため注意
またチェックはレイドを構成している場合は各ディスクごとに行う。
自分の環境ではsdaとsdbでraid1を組んでおり、それぞれ4領域に分かれており各1番めはboot-efi領域のため、(sda2,sda3,sda4,sdb2,sdb3,sdb4)の4つに対して実行

3.ブートローダーのRAID設定
grub2-efiを削除していた場合RAIDの設定が消えているため、以前に挙げたRAIDの修復と同様にRAID再度設定し再起動。

RAIDの修復