Project

General

Profile

Восстановление после аппаратной перезагрузки

Предугадать все возможные проблемы, которые могут возникнуть после аппаратной перезагрузки невозможно.
Может выйти из строя либо программная, либо физическая часть системы.
Для решения проблем требуется системный администратор с опытом работы с FreeBSD и MySQL.
Ниже приведены наиболее часто встречающиеся проблемы и пути их решения.

Система не запускается. Пинг не идет.

Подключите монитор или IP KVM и посмотрите, что на экране.
Если вы видите приглашение "login:", как указано ниже, то с системой физически все в порядке и делать ничего не нужно.

Возможно в дата центре просто проблемы с интернетом.
Обратитесь в дата центр.

Если же вы видите ошибки, то имеет место либо программная либо физическая проблема.
Программные проблемы нужно решать выполнением команд.
Физические проблемы нужно решать заменой физических сбойных компонентов сервера.

Если вы видите ошибки файловой системы, это может быть либо программной либо физической ошибкой.
Для начала попробуем программно исправить файловую систему.
Для этого физически перезагрузите сервер и нажмите 2 (Single user) в меню выбора режима загрузки:

Затем, в приглашении командной строки, нажмите Enter:

Затем запустите проверку и исправление файловой системы с автоматическим ответом Yes на все интерактивные вопросы.

fsck -y

Возможно потребуется несколько часов ожидания.
После успешного завершения процесса введите:

exit

Если это не помогает или процесс успешно не завершается, попробуйте выполнить проверку и исправление файловой системы без использования журнала UFS.
Для этого выполните fsck без дополнительных опций, и выберите N на вопрос "USE JOURNAL?".
Если это тоже не помогает, то вероятней всего у вас физические проблемы с дисковой подсистемой.
Решить их сможет только компетентный сотрудник и потребуется замена компонентов системы (жесткий диск или RAID контроллер).

Возможно, произошел полный физический сбой дисковой системы и потребуется восстановление из бекапа.
В этом случае очень важно настроить бекап системы заранее перед сбоем (см. раздел Бекап и восстановление).
Т.к. если ваша дисковая система физически вышла из строя и нет бекапов и планов действий по восстановлению, вы можете потерять все ваши данные и бизнес.

Система запустилась. Пинг идет. Однако веб-интерфейс или телефония работают некорректно.

Вероятней всего имеет место сбой базы данных вследствие некорректной перезагрузки.
Нужно исправить базу данных.

Подключитесь к серверу по SSH как root (см. раздел Как зайти на сервер под root).
Выполните

/usr/local/bin/smartswitch/repair_partition -l

Возможно потребуется несколько часов ожидания.

Если подключиться к серверу по SSH не получается, подключайтесь к серверу с монитором или IP KVM (см. п.1).
Если устранить сбой базы данных таким образом не удалось, требуется восстановление из бекапа (см. раздел Бекап и восстановление).

Also available in: PDF HTML TXT