Процесс поиска и устранения неполадок занимает значительное время в работе сетевых администраторов и технического персонала. Благодаря применению эффективных методов устранения неполадок общую длительность данного процесса удаётся сократить (если работы выполняются в производственной среде). Процесс поиска и устранения неполадок можно разбить на три основных этапа:
Этап 1. Сбор информации о симптомах — процесс поиска и устранения неполадок начинается со сбора данных и документирования симптомов, информация о которых поступает из сети, оконечных систем и от пользователей. Кроме того, сетевой администратор определяет, какие сетевые устройства были затронуты и как функционирование сети изменилось по сравнению с базовыми показателями. Симптомы могут отображаться в разном виде (предупреждения из системы управления сетями, консольные сообщения и жалобы пользователей). В ходе сбора данных о симптомах важно, чтобы сетевой администратор задавал вопросы и расследовал проблему с целью локализации проблемы до более узкого круга возможных причин её появления. Например, распространяется ли проблема на одно устройство, группу устройств, подсеть или всю сеть устройств?
Этап 2. Изоляция проблемы — изоляция представляет собой процесс исключения переменных до тех пор, пока в качестве причины не будет определена одиночная проблема или набор связанных проблем. Для этого администратор сети проверяет характеристики проблем на логических уровнях сети, чтобы выбрать наиболее вероятную причину. На этом этапе сетевой администратор может собирать информацию и документировать дополнительные симптомы в зависимости от определённых характеристик проблем.
Этап 3. Выполнение исправляющего действия — после определения причины проблемы сетевой администратор пытается её устранить путём исполнения, тестирования и документирования возможных решений. После обнаружения проблемы и определения требуемого решения администратору может понадобиться решить, можно ли немедленно реализовать решение или реализацию следует отложить. Это зависит от степени влияния изменений на пользователей и сеть. Уровень серьёзности проблемы всегда следует соотносить со степенью влияния решения. Например, если критически важный сервер или маршрутизатор необходимо выключить на длительное время, то реализацию исправления лучше отложить на конец рабочего дня. В ряде случаев до разрешения фактической проблемы можно применить обходное или временное решение. Обычно это относится к процедурам контроля изменений в сети.
Если действие по исправлению создаёт другую проблему или не устраняет существующую, то попытка решения документируется, внесенные изменения удаляются, а сетевой администратор возвращается к процедуре сбора данных о симптомах и изоляции проблемы.
Эти этапы не являются взаимоисключающими. На любом этапе процесса может возникнуть необходимость вернуться к предыдущим этапам. Например, при изоляции проблемы администратору может потребоваться сбор дополнительных симптомов. Кроме того, при попытке исправления проблемы существует риск создания другой проблемы. В этом случае следует удалить внесенные изменения и снова начать процедуру поиска и устранения неполадок.
Для каждого этапа должна быть сформирована политика устранения неполадок, включая процедуры контроля изменений. Политика позволяет организовать согласованный метод работы для каждого этапа. Среди прочего, в политике должна содержаться процедура документирования каждой важной порции информации.
Примечание. Для устранения проблем следует общаться с пользователями и любыми сотрудниками, принимающими участие в процессе поиска и устранения неполадок. Информацию о разрабатываемом решении должны получить другие сотрудники отдела ИТ. Наличие соответствующим образом оформленной документации о причине проблемы и способе её устранения позволит другим техническим специалистам предотвращать либо устранять похожие проблемы в будущем.