CBS провела аудит виртуальной инфраструктуры крупной финансовой организации

  • 21.01.2020
  • 367

Задача

Провести аудит виртуальной инфраструктуры VMware vSphere 6.7 из двадцати серверов и 3 СХД на предмет соответствия рекомендациям и лучшим практикам, а также с целью выявления узких мест.

Выполнение

В рамках аудита был выполнен детальный анализ конфигурации гипервизоров ESXi, сервера управления vCenter Server Appliance, сетевого стека и подсистемы хранения. Основной фокус был сделан на выявлении возможных узких мест в инфраструктуре, так как специалисты Заказчика сообщили о стабильно низкой производительности виртуальных машин. В процессе аудита было найдено довольно много несоответствий рекомендациям в текущей конфигурации системы, главными из которых можно назвать высокую плотность размещения высоконагруженных ВМ на физическое ядро CPU каждого хоста, а также высокие показатели latency для iSCSI SAN сети.

В рамках кластера был включен функционал DRS, который обеспечивает равномерную нагрузку на вычислительные ресурсы всех серверов кластера за счет автоматического распределения ВМ между узлами. В рамках проверяемой инфраструктуры показатель CPU Usage был в пределах нормы, поэтому специалисты Заказчика были уверены, что процессор не является узким местом в их текущей инфраструктуре. Это распространенное явление, когда администраторы принимают положительные показатели CPU Usage при включенном DRS за нормальную работу виртуальной инфраструктуры, не учитывая других более критичных метрик. В данном случае метрика CPU Ready (отображает сколько в среднем приходится ждать ВМ пока освободится ядро процессора для передачи на него команд) сигнализировала о довольно высоких показателях в несколько десятков миллисекунд. Это происходит потому, что механизм DRS лишь косвенно принимает в расчет показатель CPU Ready, затрагивая его в процессе вычислений значений CPU Demand. Чтобы снизить нагрузку на физическое ядро каждого хоста, было предложено уменьшит кол-во vCPU для oversized ВМ, а также добавить в инфраструктуру дополнительные узлы ESXi с последующей перегруппировкой ВМ и разнесением их по нескольким пулам ресурсов.

Для решения второй проблемы, снижения количества очередей к дисковым подсистемам, специалисты CBS рекомендовали заменить несколько разрозненных устаревших систем хранения данных на одну (на базе HPE Nimble Storage), а также заменить существующие iSCSI SAN коммутаторы.

Результат

В результате аудита заказчику был предоставлен детальный отчёт по текущему состоянию виртуальной инфраструктуры с перечнем рекомендаций по оптимизации. После проведения заключительного обсуждения результатов аудита с заказчиком были намечены основные шаги по дальнейшей модернизации инфраструктуры, а специалисты CBS помогли сформировать необходимые требования к новым системам.