Оповещения хранилища объектов
На основе метрик, перечисленных в разделе Метрики хранилища объектов, формируются и отображаются на панели администрирования следующие оповещения для хранилища объектов:
| Заголовок | Сообщение | Серьезность |
|---|---|---|
| Оповещения о сервисе шлюза S3 | ||
| В кластере S3 есть недоступные сервисы шлюза S3 | Некоторые сервисы шлюза S3 не выполняются на узле <node>. Проверьте статус сервисов в интерфейсе командной строки. | предупреждение |
| Высокий показатель времени ожидания GET запроса от сервиса "S3 шлюз" | У сервиса шлюза S3 (<service_id>) на узле <node> медианная задержка запросов GET превышает 1 секунду. | предупреждение |
| У сервиса шлюза S3 (<service_id>) на узле <node> медианная задержка запросов GET превышает 5 секунд. | критическое | |
| Высокий показатель отмененных запросов у сервиса "S3 шлюз" | У сервиса шлюза S3 (<service_id>) на узле <node> частота отмены запросов превышает 5 %. Это может быть вызвано проблемами с подключением, истечением времени ожидания запросов или малым предельным размером очереди ожидающих запросов. | предупреждение |
| Критический показатель отмененных запросов у сервиса "S3 шлюз" | У сервиса шлюза S3 (<service_id>) на узле <node> частота отмены запросов превышает 30 %. Это может быть вызвано проблемами с подключением, истечением времени ожидания запросов или малым предельным размером очереди ожидающих запросов. | критическое |
| Высокий показатель использования ЦП сервисом "S3 шлюз" | У сервиса шлюза S3 (<service_id>) на узле <node> использование ЦП выше 75 %. Возможно, сервис перегружен. | предупреждение |
| Критический показатель использования ЦП сервисом "S3 шлюз" | У сервиса шлюза S3 (<service_id>) на узле <node> использование ЦП выше 90 %. Возможно, сервис перегружен. | критическое |
| Слишком много завершившихся сбоем запросов в сервисе шлюза S3 | У сервиса шлюза S3 (<service_id>) на узле <node> много завершившихся сбоем запросов с ошибкой сервера (код статуса 5XX). | критическое |
| Оповещения о сервисе объектов | ||
| В кластере S3 есть недоступные сервисы объектов | Некоторые сервисы объектов не выполняются на узле <node>. Проверьте статус сервисов в интерфейсе командной строки. | предупреждение |
| Высокий показатель времени ожидания запроса от сервиса объектов | У сервиса объектов (<service_id>) на узле <node> медианная задержка запросов превышает 1 секунду. | предупреждение |
| Критический показатель времени ожидания запроса от сервиса объектов | У сервиса объектов (<service_id>) на узле <node> медианная задержка запросов превышает 5 секунд. | критическое |
| Высокий показатель времени ожидания операции commit у сервиса объектов | У сервиса объектов (<service_id>) на узле <node> медианная задержка фиксации превышает 1 секунду. Проверьте производительность хранилища. | предупреждение |
| Критический показатель времени ожидания операции commit у сервиса объектов | У сервиса объектов (<service_id>) на узле <node> медианная задержка фиксации превышает 10 секунд. Проверьте производительность хранилища. | критическое |
| Оповещения о сервисе имен | ||
| В кластере S3 есть недоступные сервисы имен | Некоторые сервисы имен не выполняются на узле <node>. Проверьте статус сервисов в интерфейсе командной строки. | предупреждение |
| Высокий показатель времени ожидания запроса от сервиса имён | У сервиса имен (<service_id>) на узле <node> медианная задержка запросов превышает 1 секунду. | предупреждение |
| Критический показатель времени ожидания запроса от сервиса имён | У сервиса имен (<service_id>) на узле <node> медианная задержка запросов превышает 5 секунд. | критическое |
| Высокий показатель времени ожидания операции commit у сервиса метаданных | У сервиса имен (<service_id>) на узле <node> медианная задержка фиксации превышает 1 секунду. Проверьте производительность хранилища. | предупреждение |
| Критический показатель времени ожидания операции commit у сервиса имён | У сервиса имен (<service_id>) на узле <node> медианная задержка фиксации превышает 10 секунд. Проверьте производительность хранилища. | критическое |
| Оповещения об агенте хранилища объектов | ||
| Агент хранилища объектов заморожен в течение длительного времени | У агента хранилища объектов на узле <node> цикл событий неактивен уже дольше 1 минуты. | критическое |
| Агент хранилища объектов недоступен | Агент хранилища объектов недоступен на узле <node>. | предупреждение |
| Агент хранилища объектов не подключен к сервису конфигурации | Агент хранилища объектов не смог подключиться к сервису конфигурации на узле <node>. | предупреждение |
| Оповещения о кластере S3 | ||
| Проблема в настройке S3 кластера | Конфигурация кластера S3 не является высокодоступной. Отказ одного сервера S3 может привести к неработоспособности всего кластера S3. | предупреждение |
| Предупреждение избыточности данных |
Для S3 задана область отказа "диск", хотя числов доступных серверов - <number_of_nodes>. Рекомендуется задать область отказа "хост", чтобы S3 мог выдержать как сбой диска, так и сервера. |
предупреждение |
| Сервис S3 заморожен в течение длительного времени | У сервиса S3 (<service_name>, <service_id>) на узле <node> цикл событий неактивен уже дольше 1 минуты. | критическое |
| Не удалось запустить сервис S3 | Агент хранилища объектов не смог запустить сервис <service_name>(<service_id>) на узле <node>. | критическое |
| В кластере S3 есть недоступные сервисы георепликации | Некоторые сервисы георепликации не выполняются на узле <node>. Проверьте статус сервисов в интерфейсе командной строки. | предупреждение |
| Другие оповещения | ||
| У сервиса NFS есть недоступные сервисы файловой системы | Некоторые сервисы файловой системы не выполняются на узле <node>. Проверьте статус сервисов в интерфейсе командной строки. | предупреждение |
| Не удалось запустить сервис файлов | Агент хранилища объектов не смог запустить сервис файлов на узле <node>. | критическое |