Оповещения инфраструктуры

На панели администрирования формируются и отображаются следующие оповещения:

Заголовок Сообщение Серьезность
Оповещения о лицензии
Лицензия не загружена Лицензия не установлена. предупреждение
Срок лицензии истек Срок лицензии кластера <cluster_name> истек. Обратитесь к своему реселлеру, чтобы срочно обновить лицензию! критическое
Не удается применить лицензию SPLA Не удается применить лицензию SPLA для кластера <cluster_name>. Обратитесь к своему реселлеру, чтобы решить проблему! критическое
Не удается передать статистику использования пространства Не удается передать статистику использования пространства для кластера <cluster_name>. Убедитесь, что узел управления подключен к Интернету. предупреждение
Не удается получить статистику использования пространства Не удается получить статистику использования пространства для кластера <cluster_name>. предупреждение
Оповещения о кластере
Недостаточно места в кластере В кластере осталось всего <free_space> TB (<free_space_in_percent> %) физического дискового пространства. Можно освободить часть пространства или увеличить емкость хранилища. предупреждение
В кластере <cluster_name> закончилось дисковое пространство, разрешенное лицензией. Дальнейшая запись данных невозможна. Обратитесь к своему реселлеру, чтобы срочно обновить лицензию! предупреждение
Осталось мало лицензированного свободного места Кластер достиг 80 % от лицензированного объёма хранилища. предупреждение
Осталось критически мало лицензированного свободного места Кластер достиг 90 % от лицензированного объёма хранилища. критическое
Недостаточно узлов в кластере В кластере <cluster_name> всего {1,2} узел (узла) вместо рекомендуемого минимума в 3 узла. Добавьте в кластер {2,1} или более узлов. предупреждение
Необходимо настроить высокую доступность для панели администрирования Настройте высокую доступность для панели администрирования в разделе «Настройки > Узел управления». Иначе панель администрирования будет единой точкой отказа. критическое
Резервная копия узла управления не существует Резервная копия узла управления старше <number_of_days> дн. критическое
Последнее резервное копирование узла управления завершилось ошибкой, резервная его копия не существует или устарела. критическое
Изменения в базе данных управления не реплицируются Изменения в базе данных управления не реплицируются на узел <hostname>, так как он недоступен. Проверьте состояние узла и его подключение к сети. критическое
Изменения в базе данных управления не реплицируются на узел <hostname>. Обратитесь в службу технической поддержки.
Оповещения о подключении кластера
Проблема с сетевым подключением кластера Проблемы с сетевым подключением всех узлов: нестабильное подключение по сети "<network_name>" вследствие потери пакетов. критическое
Проблемы с сетевым подключением всех узлов: отсутствует подключение по сети "<network_name>". критическое
Проблема с сетевым подключением узла Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери всех пакетов размера MTU. критическое
Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери некоторых пакетов размера MTU. критическое
Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение по сети "<network_name>" вследствие потери пакетов. критическое
Проблемы с сетевым подключением узла "<hostname>": отсутствует подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>". критическое
Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери всех пакетов размера MTU. критическое
Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери пакетов. критическое
Проблемы с сетевым подключением узла "<hostname>": нестабильное подключение к узлу "<hostname>" с интерфейсом "<iface>" через интерфейс "<iface>" вследствие потери некоторых пакетов размера MTU. критическое
Несовпадение MTU У некоторых интерфейсов значение MTU отличается от других интерфейсов в той же сети: сеть "<network_name>" интерфейс на хосте "<iface>@<hostname>". критическое
Оповещения об узлах
Узел не в сети Узел <hostname> не в сети. предупреждение
Узел слишком много раз оказывался недоступен по сети Узел <hostname> слишком много раз оказывался недоступен по сети за последний час. предупреждение
Ядро устарело На узле <hostname> выполняется не последняя версия ядра. предупреждение
Сработал механизм OOM Killer На узле <hostname> сработал механизм OOM Killer. предупреждение
Время не синхронизировано Время на узле <hostname> отличается от времени на узле внутреннего хранилища более чем на 5 секунд. предупреждение
Нет подключения к Интернету Узел кластера <hostname> не может связаться с репозиторием. Убедитесь, что у всех узлов в кластере есть доступ к Интернету. предупреждение
Обнаружено несовместимое оборудование На узле <hostname> обнаружено несовместимое оборудование: <hardware_list>. При использовании аппаратного обеспечения Mellanox или AMD может произойти потеря данных. Проверьте еще раз, правильно ли включена технология SR-IOV. критическое
Место в файле подкачки заканчивается <swap_proportion> % файла подкачки использовано на сервере "<hostname>". критическое
Высокий показатель использования ЦП

Сервер <hostname> имеет показатель использования ЦП выше 90 %. Текущее значение: <value> %.

предупреждение
Высокий показатель использования памяти

Сервер <hostname> имеет показатель использования памяти выше 95 %. Текущее значение: <value> %.

предупреждение
Сервер имеет высокий показатель загрузки диска

Диск /dev/<disk_name> на сервере <hostname> имеет показатель I/O выше 85 %. Текущее значение: <value> %.

предупреждение
Сервер имеет высокий показатель потерь сетевых пакетов при приёме

Высокий показатель (<value>) потерянных пакетов при приёме на сервере <hostname>. Пожалуйста, проверьте настройки сети.

предупреждение
Сервер имеет высокий показатель потерянных пакетов при передаче

Высокий показатель ( <value>) потерянных пакетов при передаче на сервере <hostname>. Пожалуйста, проверьте настройки сети.

предупреждение
Сервер имеет высокий показатель ошибок в сетевых пакетах при приёме

Высокий показатель (<value>) ошибок в сетевых пакетах при приёме на сервере <hostname>. Пожалуйста, проверьте настройки сети.

предупреждение
Сервер имеет высокий показатель ошибок в сетевых пакетах при передаче

Высокий показатель (<value>) ошибок в сетевых пакетах при передаче на сервере <hostname>. Пожалуйста, проверьте настройки сети.

предупреждение
Оповещения о диске
Предупреждение S.M.A.R.T. Диск <disk_name> (<serial>) на узле <hostname> не прошел проверку S.M.A.R.T. критическое
Ошибка диска Произошел сбой диска <disk_name> (<serial>) на узле <hostname>. критическое
Недостаточно места на диске Заканчивается место на корневом разделе узла <hostname>. предупреждение
Кэширование записи на диск включено Кэширование записи на диск включено для диска <disk_name> на узле <hostname>. Отключите его, чтобы избежать вероятной потери данных в случае отключения питания. предупреждение
Неизвестный статус кэширования записи на диск Не удается определить статус кэширования записи для диска <disk_name> на узле <hostname>. предупреждение
Программный RAID не синхронизирован

Программный RAID <disk_name> на сервере <hostname> синхронизирован на <value> %.

предупреждение
Сервис часто меняет статус

Сервис systemd <service_name> на сервере <hostname> изменил свой статус чаще, чем 5 раз в 5 минут или 15 раз в час.

критическое
Оповещения о сети
Предупреждение о сети На сетевом интерфейсе <iface_name> неправильные настройки: режим дуплекса <duplex> и скорость <speed>. предупреждение
На сетевом интерфейсе <iface_name> на узле <hostname> отсутствуют (или отключены) важные функции: <feature_name>. предупреждение
Сетевой интерфейс <iface_name> на узле <hostname> работает не в полнодуплексном режиме. предупреждение
Скорость работы сетевого интерфейса <iface_name> на узле <hostname> ниже минимально требуемой в 1 Гбит/с. предупреждение
Скорость сетевого интерфейса <iface_name> на узле <hostname> не определена. предупреждение
Сетевой интерфейс часто меняет своё состояние

Сетевой интерфейс <iface_name> на сервере <hostname> часто меняет своё состояние.

предупреждение
Нарушена отказоустойчивость агрегации сетевых интерфейсов

У агрегации <iface_name> на сервере <hostname> отсутствуют подчиненные интерфейсы: <number_of_ifaces>.

критическое
Оповещения об обновлениях
Доступны обновления системы

Доступны обновления для сервера <hostname>. Текущая версия: <current_version>. Доступна версия: <available_version>.

информация
Не удалось проверить наличие обновлений

Не удалось проверить наличие обновлений для сервера <hostname>. Пожалуйста, проверьте доступ к репозиторию.

предупреждение
Не удалось проверить наличие обновлений несколько раз подряд

Не удалось проверить наличие обновлений несколько раз подряд. Пожалуйста, проверьте доступ к репозиторию.

критическое
Не удалось загрузить обновление

Не удалось загрузить обновление на сервер <hostname>.

критическое
Ошибка обновления сервера

Не удалось загрузить обновление на сервер <hostname>.

критическое
Ошибка обновления Не удалось завершить обновление для панели управления и вычислительного API-интерфейса. критическое
Ошибка обновления кластера Ошибка обновления кластера. критическое
Не удалось перевести сервер в режим обслуживания для обновления

Не удалось перевести сервер <hostname> в режим обслуживания для обновления.

критическое
Оповещения о службах
Произошел сбой вычислительного кластера Произошел отказ вычислительного кластера. Управление виртуальными машинами невозможно. критическое
Срок действия сертификата Срок действия сертификата Cyber Backup Gateway истек. Все операции резервного копирования остановлены. Обновите сертификат на экране Backup Gateway. критическое
Срок действия сертификата Cyber Backup Gateway вскоре истечет. Обновите сертификат на экране Backup Gateway. предупреждение
Срок действия сертификата Cyber Backup Gateway истекает <expiration_date>. Обновите сертификат на экране Backup Gateway.
Предупреждение о избыточности Для iSCSI LUN <lun_id> из группы целевых устройств <target_group> установлена область отказа «диск», хотя доступное количество узлов — <number_of_nodes>. Рекомендуется установить область отказа «хост», чтобы идентификатор LUN мог выдерживать сбои хостов в дополнение к сбоям дисков. предупреждение
Сбой крупного обновления iSCSI Сбой крупного обновления iSCSI. Будет выполнена повторная попытка... критическое
NFS имеет недоступные файловые сервисы

Некоторые файловые сервисы не запущены на сервере <node>. Проверьте статус сервисов в интерфейсе командной строки.

предупреждение