Оповещения инфраструктуры
На панели администрирования формируются и отображаются следующие оповещения:
| Заголовок | Сообщение | Серьезность |
|---|---|---|
| Оповещения о лицензии | ||
| Лицензия не загружена | Лицензия не установлена. | предупреждение |
| Срок лицензии истек | Срок лицензии кластера <cluster_name> истек. Обратитесь к своему реселлеру, чтобы срочно обновить лицензию! | критическое |
| Не удается применить лицензию SPLA | Не удается применить лицензию SPLA для кластера <cluster_name>. Обратитесь к своему реселлеру, чтобы решить проблему! | критическое |
| Не удается передать статистику использования пространства | Не удается передать статистику использования пространства для кластера <cluster_name>. Убедитесь, что узел управления подключен к Интернету. | предупреждение |
| Не удается получить статистику использования пространства | Не удается получить статистику использования пространства для кластера <cluster_name>. | предупреждение |
| Оповещения о кластере | ||
| Недостаточно места в кластере | В кластере осталось всего <free_space> TB (<free_space_in_percent> %) физического дискового пространства. Можно освободить часть пространства или увеличить емкость хранилища. | предупреждение |
| В кластере <cluster_name> закончилось дисковое пространство, разрешенное лицензией. Дальнейшая запись данных невозможна. Обратитесь к своему реселлеру, чтобы срочно обновить лицензию! | предупреждение | |
| Осталось мало лицензированного свободного места | Кластер достиг 80 % от лицензированного объёма хранилища. | предупреждение |
| Осталось критически мало лицензированного свободного места | Кластер достиг 90 % от лицензированного объёма хранилища. | критическое |
| Недостаточно узлов в кластере | В кластере <cluster_name> всего {1,2} узел (узла) вместо рекомендуемого минимума в 3 узла. Добавьте в кластер {2,1} или более узлов. | предупреждение |
| Необходимо настроить высокую доступность для панели администрирования | Настройте высокую доступность для панели администрирования в разделе «Настройки > Узел управления». Иначе панель администрирования будет единой точкой отказа. | критическое |
| Резервная копия узла управления не существует | Резервная копия узла управления старше <number_of_days> дн. | критическое |
| Последнее резервное копирование узла управления завершилось ошибкой, резервная его копия не существует или устарела. | критическое | |
| Изменения в базе данных управления не реплицируются | Изменения в базе данных управления не реплицируются на узел <hostname>, так как он недоступен. Проверьте состояние узла и его подключение к сети. | критическое |
| Изменения в базе данных управления не реплицируются на узел <hostname>. Обратитесь в службу технической поддержки. | ||
| Оповещения о подключении кластера | ||
| Проблема с сетевым подключением кластера | Проблемы с сетевым подключением всех узлов: нестабильное подключение по сети "<network_name>" вследствие потери пакетов. | критическое |
| Проблемы с сетевым подключением всех узлов: отсутствует подключение по сети "<network_name>". | критическое | |
| Проблема с сетевым подключением узла | Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери всех пакетов размера MTU. | критическое |
| Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери некоторых пакетов размера MTU. | критическое | |
| Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери пакетов. | критическое | |
| Проблемы с сетевым подключением узла "<hostname>": отсутствует подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>". | критическое | |
| Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери всех пакетов размера MTU. | критическое | |
| Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери пакетов. | критическое | |
| Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери некоторых пакетов размера MTU. | критическое | |
| Несовпадение MTU | У некоторых интерфейсов значение MTU отличается от других интерфейсов в той же сети: сеть "<network_name>" интерфейс на хосте "<iface>@<hostname>". | критическое |
| Оповещения об узлах | ||
| Узел не в сети | Узел <hostname> не в сети. | предупреждение |
| Узел слишком много раз оказывался недоступен по сети | Узел <hostname> слишком много раз оказывался недоступен по сети за последний час. | предупреждение |
| Ядро устарело | На узле <hostname> выполняется не последняя версия ядра. | предупреждение |
| Сработал механизм OOM Killer | На узле <hostname> сработал механизм OOM Killer. | предупреждение |
| Время не синхронизировано | Время на узле <hostname> отличается от времени на узле внутреннего хранилища более чем на 5 секунд. | предупреждение |
| Нет подключения к Интернету | Узел кластера <hostname> не может связаться с репозиторием. Убедитесь, что у всех узлов в кластере есть доступ к Интернету. | предупреждение |
| Обнаружено несовместимое оборудование | На узле <hostname> обнаружено несовместимое оборудование: <hardware_list>. При использовании аппаратного обеспечения Mellanox или AMD может произойти потеря данных. Проверьте еще раз, правильно ли включена технология SR-IOV. | критическое |
| Место в файле подкачки заканчивается | <swap_proportion> % файла подкачки использовано на сервере "<hostname>". | критическое |
| Высокий показатель использования ЦП |
Сервер <hostname> имеет показатель использования ЦП выше 90 %. Текущее значение: <value> %. |
предупреждение |
| Высокий показатель использования памяти |
Сервер <hostname> имеет показатель использования памяти выше 95 %. Текущее значение: <value> %. |
предупреждение |
| Сервер имеет высокий показатель загрузки диска |
Диск /dev/<disk_name> на сервере <hostname> имеет показатель I/O выше 85 %. Текущее значение: <value> %. |
предупреждение |
| Сервер имеет высокий показатель потерь сетевых пакетов при приёме |
Высокий показатель (<value>) потерянных пакетов при приёме на сервере <hostname>. Пожалуйста, проверьте настройки сети. |
предупреждение |
| Сервер имеет высокий показатель потерянных пакетов при передаче |
Высокий показатель ( <value>) потерянных пакетов при передаче на сервере <hostname>. Пожалуйста, проверьте настройки сети. |
предупреждение |
| Сервер имеет высокий показатель ошибок в сетевых пакетах при приёме |
Высокий показатель (<value>) ошибок в сетевых пакетах при приёме на сервере <hostname>. Пожалуйста, проверьте настройки сети. |
предупреждение |
| Сервер имеет высокий показатель ошибок в сетевых пакетах при передаче |
Высокий показатель (<value>) ошибок в сетевых пакетах при передаче на сервере <hostname>. Пожалуйста, проверьте настройки сети. |
предупреждение |
| Оповещения о диске | ||
| Предупреждение S.M.A.R.T. | Диск <disk_name> (<serial>) на узле <hostname> не прошел проверку S.M.A.R.T. | критическое |
| Ошибка диска | Произошел сбой диска <disk_name> (<serial>) на узле <hostname>. | критическое |
| Недостаточно места на диске | Заканчивается место на корневом разделе узла <hostname>. | предупреждение |
| Кэширование записи на диск включено | Кэширование записи на диск включено для диска <disk_name> на узле <hostname>. Отключите его, чтобы избежать вероятной потери данных в случае отключения питания. | предупреждение |
| Неизвестный статус кэширования записи на диск | Не удается определить статус кэширования записи для диска <disk_name> на узле <hostname>. | предупреждение |
| Программный RAID не синхронизирован |
Программный RAID <disk_name> на сервере <hostname> синхронизирован на <value> %. |
предупреждение |
| Сервис часто меняет статус |
Сервис systemd <service_name> на сервере <hostname> изменил свой статус чаще, чем 5 раз в 5 минут или 15 раз в час. |
критическое |
| Оповещения о сети | ||
| Предупреждение о сети | На сетевом интерфейсе <iface_name> неправильные настройки: режим дуплекса <duplex> и скорость <speed>. | предупреждение |
| На сетевом интерфейсе <iface_name> на узле <hostname> отсутствуют (или отключены) важные функции: <feature_name>. | предупреждение | |
| Сетевой интерфейс <iface_name> на узле <hostname> работает не в полнодуплексном режиме. | предупреждение | |
| Скорость работы сетевого интерфейса <iface_name> на узле <hostname> ниже минимально требуемой в 1 Гбит/с. | предупреждение | |
| Скорость сетевого интерфейса <iface_name> на узле <hostname> не определена. | предупреждение | |
| Сетевой интерфейс часто меняет своё состояние |
Сетевой интерфейс <iface_name> на сервере <hostname> часто меняет своё состояние. |
предупреждение |
| Нарушена отказоустойчивость агрегации сетевых интерфейсов |
У агрегации <iface_name> на сервере <hostname> отсутствуют подчиненные интерфейсы: <number_of_ifaces>. |
критическое |
| Оповещения об обновлениях | ||
| Доступны обновления системы |
Доступны обновления для сервера <hostname>. Текущая версия: <current_version>. Доступна версия: <available_version>. |
информация |
| Не удалось проверить наличие обновлений |
Не удалось проверить наличие обновлений для сервера <hostname>. Пожалуйста, проверьте доступ к репозиторию. |
предупреждение |
| Не удалось проверить наличие обновлений несколько раз подряд |
Не удалось проверить наличие обновлений несколько раз подряд. Пожалуйста, проверьте доступ к репозиторию. |
критическое |
| Не удалось загрузить обновление |
Не удалось загрузить обновление на сервер <hostname>. |
критическое |
| Ошибка обновления сервера |
Не удалось загрузить обновление на сервер <hostname>. |
критическое |
| Ошибка обновления | Не удалось завершить обновление для панели управления и вычислительного API-интерфейса. | критическое |
| Ошибка обновления кластера | Ошибка обновления кластера. | критическое |
| Не удалось перевести сервер в режим обслуживания для обновления |
Не удалось перевести сервер <hostname> в режим обслуживания для обновления. |
критическое |
| Оповещения о службах | ||
| Произошел сбой вычислительного кластера | Произошел отказ вычислительного кластера. Управление виртуальными машинами невозможно. | критическое |
| Срок действия сертификата | Срок действия сертификата Cyber Backup Gateway истек. Все операции резервного копирования остановлены. Обновите сертификат на экране Backup Gateway. | критическое |
| Срок действия сертификата Cyber Backup Gateway вскоре истечет. Обновите сертификат на экране Backup Gateway. | предупреждение | |
| Срок действия сертификата Cyber Backup Gateway истекает <expiration_date>. Обновите сертификат на экране Backup Gateway. | ||
| Предупреждение о избыточности | Для iSCSI LUN <lun_id> из группы целевых устройств <target_group> установлена область отказа «диск», хотя доступное количество узлов — <number_of_nodes>. Рекомендуется установить область отказа «хост», чтобы идентификатор LUN мог выдерживать сбои хостов в дополнение к сбоям дисков. | предупреждение |
| Сбой крупного обновления iSCSI | Сбой крупного обновления iSCSI. Будет выполнена повторная попытка... | критическое |
| NFS имеет недоступные файловые сервисы |
Некоторые файловые сервисы не запущены на сервере <node>. Проверьте статус сервисов в интерфейсе командной строки. |
предупреждение |