Мониторинг кластера хранилища данных

Чтобы просмотреть статус кластера хранилища

Панель администратора

Щелкните по имени кластера в нижней части левого меню. Статус может иметь следующие значения:

Исправен
Все компоненты кластера активны и нормально работают.
Недоступен
Недостаточно информации о состоянии кластера (например, из-за отсутствия доступа к кластеру).
Деградировал
Некоторые из компонентов кластера неактивны или недоступны. Кластер пытается исправить свое состояние, репликация данных запланирована или выполняется.
Ошибка
В кластере слишком много неактивных сервисов, и автоматическая репликация отключена. Если кластер окажется в этом состоянии, устраните неполадки на серверах или обратитесь в службу поддержки.

Интерфейс командной строки

Используйте следующую команду:

vinfra cluster overview

Например, чтобы просмотреть статус кластера cluster1, взгляните на эту строку в выводе команды:

+-------------------+-------------------------+
| Field             | Value                   |
+-------------------+-------------------------+
| ...               | ...                     |
| status            | healthy                 |
| ...               | ...                     |
+-------------------+-------------------------+

Чтобы просмотреть статистику кластера хранилища

Панель администратора

Перейдите на экран Мониторинг > Обзор.

  • Чтобы просмотреть статистику кластера хранилища во весь экран, нажмите Полноэкранный режим.
  • Для выхода из полноэкранного режима нажмите клавишу Esc или кнопку Выйти из полноэкранного режима.

Интервал времени для диаграмм по умолчанию составляет двенадцать часов. Чтобы рассмотреть определенный интервал времени в большем масштабе, выделите его мышью; чтобы восстановить прежний масштаб, дважды щелкните по любой диаграмме.

Интерфейс командной строки

Используйте следующую команду:

vstorage -c <cluster_name> top

Например, чтобы просмотреть общую информацию о кластере cluster1, взгляните на эту секцию в выводе команды:

Cluster 'cluster1': healthy
Space: [OK] allocatable 11.9TB of 57.3TB, free 13.0TB of 57.3TB
MDS nodes: 3 of 3, epoch uptime: 13d  3h
CS nodes:  32 of 32 (32 avail, 0 inactive, 0 offline)
License: ACTIVE (expiration: 01/01/2100, capacity: 500TB, used: 21.2TB)
Replication:  1 norm,  1 limit
IO:       read 26.2MB/s (1.9Kop/s), write  426MB/s (11Kops/s)
Cluster

Общее состояние кластера:

healthy
Все серверы фрагментов данных в этом кластере активны.
unknown
Недостаточно информации о состоянии этого кластера (например, потому, что главный сервер метаданных был выбран только некоторое время назад).
degraded
Часть серверов фрагментов данных в кластере неактивна.
failure
В кластере слишком много неактивных серверов фрагментов данных; автоматическая репликация отключена.
SMART warning
У одного или нескольких физических дисков, подключенных к серверам кластера, близится аппаратный отказ.
Space

Количество дискового пространства в кластере:

free
Свободное дисковое пространство в кластере.
allocatable
Объем логического дискового пространства, доступного для клиентов. Доступное для выделения дисковое пространство рассчитывается на основе текущих параметров репликации и объема свободного дискового пространства на серверах фрагментов данных. Он также может ограничиваться лицензией.
MDS nodes

Количество активных серверов метаданных по сравнению с общим числом серверов метаданных, настроенных для кластера.

epoch uptime
Время, прошедшее с момента выбора главного сервера метаданных.
CS nodes

Количество активных серверов фрагментов данных по сравнению с общим числом серверов фрагментов данных, настроенных для кластера. В скобках отображается дополнительная информация об этих серверах фрагментов данных.

avail
Активные серверы фрагментов данных, которые в настоящее время запущены и работают в кластере.
inactive
Неактивные серверы фрагментов данных, которые в настоящее время недоступны. Сервер фрагментов данных помечается как неактивный в течение первых 5 минут его неактивности.
offline
Отключенные серверы фрагментов данных, которые были неактивны в течение более 5 минут. Сервер фрагментов данных меняет свое состояние на отключенный, если он неактивен больше 5 минут. После изменения состояния сервера на отключенный кластер начинает репликацию данных, чтобы восстановить фрагменты, которые хранились на отключенном сервере фрагментов данных.
License
Номер ключа, под которым лицензия зарегистрирована на сервере аутентификации с ключом, и состояние лицензии.
Replication
Параметры репликации. Нормальное количество реплик фрагментов и предельное число, ниже которого фрагмент блокируется до момента, когда он будет восстановлен.
IO

Активность дискового ввода-вывода в кластере:

  • Скорость операций ввода-вывода при чтении и записи в байтах в секунду.
  • Количество операций ввода-вывода (чтения и записи) в секунду.

Чтобы просмотреть дополнительные сведения о кластере хранилища

Перейдите на экран Мониторинг > Обзор и щелкните Панель Grafana.

Откроется отдельная вкладка браузера с предварительно настроенными панелями Grafana, где можно управлять существующими панелями мониторинга, создавать новые, предоставлять доступ к ним другим пользователям, настраивать оповещения и т. д. На панелях используется источник данных Prometheus, метрики которого хранятся в течение семи дней. Если вы хотите увеличить срок хранения, его можно настроить вручную. Дополнительные сведения см. в документации Grafana.