Метрики хранилища объектов

Метрики, используемые для мониторинга хранилища объектов, настраиваются в правилах записи Prometheus, и их можно найти в следующих файлах на каждом из узлов в кластере:

  • /var/lib/prometheus/rules/s3.rules
  • /var/lib/prometheus/rules/ostor.rules

Метрики, используемые для создания оповещений по хранилищу объектов, добавляются в правила оповещений в файле /var/lib/prometheus/alerts/s3.rules. Эти метрики описаны в следующей таблице:

Метрика Описание
instance_vol_svc:ostor_s3gw_req:rate5m Количество всех запросов за секунду для определенного сервиса шлюза S3 в течение 5 минут
instance_vol_svc:ostor_s3gw_req_cancelled:rate5m Количество отмененных запросов за секунду для определенного сервиса шлюза S3 в течение 5 минут
instance_vol_svc:ostor_req_server_err:rate5m Количество запросов, завершившихся сбоем с ошибкой сервера (код состояния 5XX) за секунду для определенного сервиса шлюза S3 в течение 5 минут
instance_vol_svc:ostor_s3gw_get_req_latency_ms_bucket:rate5m Текущая задержка запросов GET для определенного шлюза S3 в течение 5 минут, для каждой из корзин
instance_vol_svc:ostor_commit_latency_us_bucket:rate5m Текущая задержка фиксации в сервисе хранилища объектов в течение 5 минут, для каждой из корзин
instance_vol_svc_req:ostor_os_req_latency_ms_bucket:rate5m Текущая задержка запросов для определенного сервиса OS в течение 5 минут, для каждой из корзин
instance_vol_svc_req:ostor_ns_req_latency_ms_bucket:rate5m Текущая задержка запросов для определенного сервиса NS в течение 5 минут, для каждой из корзин
pcs_process_inactive_seconds_total Суммарная длительность времени, в течение которого процесс был неактивен
process_cpu_seconds_total Суммарная длительность времени, в течение которого процесс использовал ЦП
ostor_svc_start_failed_count_total Общее количество неудавшихся попыток запустить сервис
ostor_svc_registry_cfg_failed_total Общее количество неудавшихся попыток подключиться к сервису конфигурации

Метрики использования хранилища объектов корзинами и пользователями

Метрики использования хранилища объектов корзинами и пользователями выключены по умолчанию. Чтобы включить сбор этой статистики, выполните следующую команду на любом узле кластера S3:

# ostor-ctl set-vol -V 0100000000000002 --enable-stat

Следующие метрики появятся в Prometheus:

  • account_control_buckets_size: Размер корзины в байтах

  • account_control_user_size: Общий размер всех корзин пользователя в байтах