Оповещения основного хранилища
На основе метрик, перечисленных в разделе Метрики основного хранилища, формируются и отображаются на панели администрирования следующие оповещения для основного хранилища:
| Заголовок | Сообщение | Серьезность |
|---|---|---|
| Оповещения о сервисе метаданных | ||
| Недостаточно дисков метаданных | В кластере <cluster_name> имеется только один MDS. В настоящий момент есть только один диск с ролью метаданных. Потеря этого диска полностью уничтожит все данные кластера, независимо от схемы избыточности. | критическое |
| Кластеру <cluster_name> требуется больше дисков с ролью метаданных. Потеря еще одного MDS остановит работу кластера. | предупреждение | |
| Предупреждение о конфигурации | На узле <hostname> размещено больше одного сервиса метаданных. Рекомендуется размещать только один сервис метаданных на узел. Удалите дополнительные сервисы метаданных с этого узла и создайте их на других узлах. | предупреждение |
| В кластере “<cluster_name>” четыре сервиса метаданных. Эта конфигурация замедляет работу кластера и не повышает его доступность. Для кластера из четырех узлов достаточно настроить три сервиса MDS. Удалите лишний сервис MDS с одного из узлов кластера. | ||
| В кластере “<cluster_name>” больше пяти сервисов метаданных. Эта конфигурация замедляет работу кластера и не повышает его доступность. Для большого кластера достаточно настроить пять сервисов MDS. Удалите лишние сервисы MDS с узлов кластера. | ||
| Сбой сервиса | Сервис метаданных #<id> находится в состоянии «<status>». Узел: <hostname>. Диск: <disk_name>. Серийный номер диска: <disk_serial>. | предупреждение |
| Недостаточно места на диске метаданных | Заканчивается место на диске метаданных узла <hostname>. | предупреждение |
| У сервиса метаданных высокий уровень использования ЦП | У сервиса метаданных на узле <node> использование ЦП выше 80 %. Возможно, сервис перегружен. | предупреждение |
| Высокий показатель времени ожидания операции commit у сервиса метаданных | У сервиса метаданных на узле <node> 95-й процентиль задержки превышает 1 секунду. | предупреждение |
| Критический показатель времени ожидания операции commit у сервиса метаданных | У сервиса метаданных на узле <node> 95-й процентиль задержки превышает 5 секунд. | критическое |
| В кластере есть недоступные сервисы метаданных | Некоторые сервисы метаданных недоступны, или в них произошел сбой. Проверьте и перезапустите их. | предупреждение |
| Главный сервис метаданных меняется слишком часто | Главный сервис метаданных изменился более одного раза за 5 минут. | предупреждение |
| Оповещения о сервисе фрагментов | ||
| Недостаточно дисков с ролью хранилища | В кластере <cluster_name> нет дисков с ролью хранилища. | предупреждение |
| В кластере <cluster_name> слишком мало доступных CS. | предупреждение | |
| Сбой сервиса | Сервис хранения данных #<id> находится в состоянии «<status>». Узел: <hostname>. Диск: <disk_name>. Серийный номер диска: <disk_serial>. | предупреждение |
| Неоптимальная конфигурация CS | CS#<cs_id> на уровне <tier> имеет неверные настройки журналирования. | предупреждение |
| Шифрование отключено для CS#<cs_id> на уровне <tier>, но включено для других CS на том же уровне. | предупреждение | |
| Диск хранилища работает медленно | Диск <disk_name> (CS#<cs_id>) на узле <hostname> работает медленно, его необходимо заменить. | предупреждение |
| Настройки кэша диска неоптимальны | У диска <disk_name> (CS#<cs_id>) на узле <hostname> настройки кэша отличаются от других дисков на том же уровне. | предупреждение |
| В кластере есть медленные сервисы фрагментов данных | Некоторые сервисы фрагментов данных работают замедленно и ухудшают производительность кластера. | предупреждение |
| В кластере есть выключенные CS сервисы | Некоторые CS сервисы отключены. Проверьте и перезапустите их. | предупреждение |
| В кластере есть отказавшие сервисы фрагментов данных | Некоторые сервисы фрагментов данных отказали. Возможно, это вызвано физическим отказом накопителя. | предупреждение |
| Оповещения о кластере хранилища | ||
| В кластере заканчивается физическое пространство | На всех уровнях хранилища осталось мало свободного физического пространства. | предупреждение |
| В кластере закончилось физическое пространство | На всех уровнях хранилища недостаточно свободного физического пространства. | критическое |
| На узле имеются зависшие запросы ввода-вывода | Некоторые запросы ввода-вывода зависли на узле <node>. | критическое |
| Репликация в кластере заблокирована или замедлена | Репликация фрагментов заблокирована или идет слишком медленно. | критическое |
| На узле имеются сбойные запросы сопоставления | Некоторые из запросов сопоставления на узле <node> завершились сбоем. | критическое |
| В кластере очень много фрагментов данных | В кластере слишком много фрагментов данных, что замедляет службу метаданных. | предупреждение |
| В кластере критически много фрагментов данных | В кластере слишком много фрагментов данных, что замедляет службу метаданных. | критическое |
| В кластере очень много файлов | В кластере слишком много файлов, что замедляет службу метаданных. | предупреждение |
| В кластере критически много файлов | В кластере слишком много файлов, что замедляет службу метаданных. | критическое |
| В кластере имеются отказавшие точки подключения | Некоторые точки подключения перестали работать, и их необходимо восстановить. | критическое |
| В кластере имеются невыровненные операции записи при вводе-выводе | Операции записи при вводе-выводе выполняются без выравнивания по границам кластеров. Это может быть вызвано тем, что диск неправильно отформатирован в виртуальной машине. | информация |
| В кластере имеются невыровненные операции чтения при вводе-выводе | Операции чтения при вводе-выводе выполняются без выравнивания по границам кластеров. Это может быть вызвано тем, что диск неправильно отформатирован в виртуальной машине. | информация |
| В журнале CS заканчивается пространство | В журнале CS осталось менее 20 % свободного пространства. | предупреждение |