Мониторинг кластера хранилища данных
Чтобы просмотреть статус кластера хранилища
Панель администратора
Щелкните по имени кластера в нижней части левого меню. Статус может иметь следующие значения:
- Исправен
- Все компоненты кластера активны и нормально работают.
- Недоступен
- Недостаточно информации о состоянии кластера (например, из-за отсутствия доступа к кластеру).
- Деградировал
- Некоторые из компонентов кластера неактивны или недоступны. Кластер пытается исправить свое состояние, репликация данных запланирована или выполняется.
- Ошибка
- В кластере слишком много неактивных сервисов, и автоматическая репликация отключена. Если кластер окажется в этом состоянии, устраните неполадки на серверах или обратитесь в службу поддержки.
Интерфейс командной строки
Используйте следующую команду:
vinfra cluster overview
Например, чтобы просмотреть статус кластера cluster1, взгляните на эту строку в выводе команды:
+-------------------+-------------------------+ | Field | Value | +-------------------+-------------------------+ | ... | ... | | status | healthy | | ... | ... | +-------------------+-------------------------+
Чтобы просмотреть статистику кластера хранилища
Панель администратора
Перейдите на экран Мониторинг > Обзор.
- Чтобы просмотреть статистику кластера хранилища во весь экран, нажмите Полноэкранный режим.
- Для выхода из полноэкранного режима нажмите клавишу Esc или кнопку Выйти из полноэкранного режима.
Интервал времени для диаграмм по умолчанию составляет двенадцать часов. Чтобы рассмотреть определенный интервал времени в большем масштабе, выделите его мышью; чтобы восстановить прежний масштаб, дважды щелкните по любой диаграмме.
Интерфейс командной строки
Используйте следующую команду:
vstorage -c <cluster_name> top
Например, чтобы просмотреть общую информацию о кластере cluster1, взгляните на эту секцию в выводе команды:
Cluster 'cluster1': healthy Space: [OK] allocatable 11.9TB of 57.3TB, free 13.0TB of 57.3TB MDS nodes: 3 of 3, epoch uptime: 13d 3h CS nodes: 32 of 32 (32 avail, 0 inactive, 0 offline) License: ACTIVE (expiration: 01/01/2100, capacity: 500TB, used: 21.2TB) Replication: 1 norm, 1 limit IO: read 26.2MB/s (1.9Kop/s), write 426MB/s (11Kops/s)
Cluster-
Общее состояние кластера:
healthy- Все серверы фрагментов данных в этом кластере активны.
unknown- Недостаточно информации о состоянии этого кластера (например, потому, что главный сервер метаданных был выбран только некоторое время назад).
degraded- Часть серверов фрагментов данных в кластере неактивна.
failure- В кластере слишком много неактивных серверов фрагментов данных; автоматическая репликация отключена.
SMART warning- У одного или нескольких физических дисков, подключенных к серверам кластера, близится аппаратный отказ.
Space-
Количество дискового пространства в кластере:
free- Свободное дисковое пространство в кластере.
allocatable- Объем логического дискового пространства, доступного для клиентов. Доступное для выделения дисковое пространство рассчитывается на основе текущих параметров репликации и объема свободного дискового пространства на серверах фрагментов данных. Он также может ограничиваться лицензией.
MDS nodes-
Количество активных серверов метаданных по сравнению с общим числом серверов метаданных, настроенных для кластера.
epoch uptime- Время, прошедшее с момента выбора главного сервера метаданных.
CS nodes-
Количество активных серверов фрагментов данных по сравнению с общим числом серверов фрагментов данных, настроенных для кластера. В скобках отображается дополнительная информация об этих серверах фрагментов данных.
avail- Активные серверы фрагментов данных, которые в настоящее время запущены и работают в кластере.
inactive- Неактивные серверы фрагментов данных, которые в настоящее время недоступны. Сервер фрагментов данных помечается как неактивный в течение первых 5 минут его неактивности.
offline- Отключенные серверы фрагментов данных, которые были неактивны в течение более 5 минут. Сервер фрагментов данных меняет свое состояние на отключенный, если он неактивен больше 5 минут. После изменения состояния сервера на отключенный кластер начинает репликацию данных, чтобы восстановить фрагменты, которые хранились на отключенном сервере фрагментов данных.
License- Номер ключа, под которым лицензия зарегистрирована на сервере аутентификации с ключом, и состояние лицензии.
Replication- Параметры репликации. Нормальное количество реплик фрагментов и предельное число, ниже которого фрагмент блокируется до момента, когда он будет восстановлен.
IO-
Активность дискового ввода-вывода в кластере:
- Скорость операций ввода-вывода при чтении и записи в байтах в секунду.
- Количество операций ввода-вывода (чтения и записи) в секунду.
Чтобы просмотреть дополнительные сведения о кластере хранилища
Перейдите на экран Мониторинг > Обзор и щелкните Панель Grafana.
Откроется отдельная вкладка браузера с предварительно настроенными панелями Grafana, где можно управлять существующими панелями мониторинга, создавать новые, предоставлять доступ к ним другим пользователям, настраивать оповещения и т. д. На панелях используется источник данных Prometheus, метрики которого хранятся в течение семи дней. Если вы хотите увеличить срок хранения, его можно настроить вручную. Дополнительные сведения см. в документации Grafana.