Nutanix HCI - альтернатива классической SAN архитектуре

  • 13.02.2024
  • 28

Автор
Иван Первицкий (NCSE, VCP, MCSE)

Ведущий системный инженер


Оглавление

Высокая отказоустойчивость Nutanix

Если в общем о гиперконвергенции (HCI). Существует всего 2 вендора, которые предлагают подобные решения корпоративного класса (нормальные по функционалу и надежности) – Nutanix HCI и VMware с продуктом vSAN.

Если сравнивать, то Nutanix смотрится выигрышнее. Меньше ручной работы, проще и быстрее переживает отказы компонент.

Суть проста: Nutanix это одна ВМ на каждом хосте. В этих ВМ вся логика по организации распределенного хранилища. Каждый блок хранится дважды или трижды и распределяется по всем узлам равномерно.

Вот скрин из презентации, где на каждом узле работает ВМ с Nutanix AOS (Acropolis Operating System) и службой управления Prism. Работает ВМ на собственном гипервизоре Nutanix – Acropolis Hypervisor (AHV), но можно использовать любой популярный – ESXi или Hyper-V.

Nutanix

ВМ пользователя представлена на скрине четырьмя блоками ABCD. Чтение происходит локально с той ноды, где запущена ВМ для достижения наибольшей производительности. Запись идет на ту ноду, где запущена ВМ и параллельно на другие ноды для достижения отказоустойчивости. В системе это называется фактор репликации, он может быть равен 2 или 3 (на скрине RF=2). То есть каждый блок данных будет записан дважды или трижды. Поэтому минимум 50% полезного пространства отъедается под нужны RF=2 (при RF=3 доступно примерно 33%). Но стоит помнить, что серверные диски стоят куда дешевле, чем специализированные диски для СХД именитых вендоров (для того же 3PAR или Primera стоимость одного HDD в канале HPE доходила до 10-15к USD, не говоря уже о SSD).

При отказе первой ноды на скрине, произойдет самое обычное событие HA (High Availability). Все данные есть на других нодах. ВМ сразу начнет стартовать на ноде 2 (к примеру), чтение блоков BC и запись всех новых блоков будет идти локально. А чтение блоков AD будет идти какое-то время по сети с ноды 3. Параллельно блоки AD будут скопированы на ноду 2, после чего начнется проверка и обеспечение фактора репликации –блоки BC будут скопированы на ноду 3.

Простота управления

Такой подход сильно снижает область обслуживания и траблшутинга всех систем. Всего одна консоль Prism (причем в отказоустойчивом варианте, на каждой ноде свой инстанс Prism) для управления всем – вычислениями, ВМ, стораджами и сетью, вместо отдельной консоли vCenter, ESXi, Storage Management, SAN Switch Management.

При этом интерфейс Prism можно освоить за неделю в полной мере, а какие-то нечастые задачи по восстановлению работоспособности ноды/диска решаются в пару кликов. То же справедливо и для добавления новых ресурсов.

Также хотел от себя добавить несколько слов про HCI в целом и Nutanix в частности, а также поделиться полезными ресурсами на эту тему.
Вот некоторые тезисы:

Nutanix работает на любом железе

Nutanix это только софт, ему фактически все равно на каком железе работать. Для себя они выбрали американскую версию Supermicro в качестве «родного» аппаратного решения и продают его у себя в канале. Для всех остальных вендоров железо считается отдельно, а софт отдельно. Мы предлагаем использовать сертифицированные серверы Lenovo HX, которые оптимизированы специально для работы Nutanix HCI.

Узкое место традиционных СХД

В традиционных СХД (та же Dell ME, HPE MSA, HPE Nimble) только 2 контроллера. Кэш на запись небольшой. Один том обслуживается только одним контроллером (ассиметричный Active-Active). Непрогнозируемая нагрузка на SAN сеть и синдром "шумного соседа" (когда одна ВМ мешает работать остальным, отъедая весь кэш и генерируя высокие очереди. Особенно критично для VDI и терминалов). При отказе одного контроллера, кэш на запись отключается на оставшемся контроллере, и деградация производительности становится ощутима.

В Nutanix каждый сервер по сути является контроллером СХД. Кэш на запись в каждом узле изменяется динамически и может достигать 400ГБ на сервер. Каждый узел обслуживает каждый том (концепция Mesh-Active). Помимо этого, в Nutanix используется механизм Data Locality при котором ВМ физически размещены на локальных дисках тех узлов, чьи ресурсы они используют (RAM, CPU). В случае Data Locality чтение идет быстрее, чем в других системах HCI (Azure Stack, vSAN) и др.

Надежность хранения данных

Полезное пространство в Nutanix всегда считается с запасом. Абсолютно каждый блок данных в системе дублируется дважды (при RF=2, минимум 3 ноды) или трижды при (RF=3, минимум 5 нод).

В традиционных системах хранения данных, блок пишется единожды и данные фактически защищены дублированием контроллеров и RAID массивами.

Высокая скорость восстановления утерянных данных

В системе Nutanix нет RAID, который при операциях rebuild всегда дает ощутимую потерю производительности и, что более важно, надежности:

  • RAID5 при ребилде читает со всех дисков и пишет на 1. Если потеряется второй диск в этот момент, то все данные на массиве будут потеряны;
  • RAID10. Вроде и быстр и надежен, но отказ двух дисков из одной группы RAID1 массив не переживет и все данные будут потеряны.

Легкость масштабирования кластера на Nutanix

Любой апгрейд СХД – это добавление полок расширения. Но что делать, если закончилась производительность на контроллерах. К примеру, весь кэш утилизирован другими приложениями и добавление еще одного приложения приведет к перестройке кэша и деградации производительности существующих сервисов.

В Nutanix вам достаточно добавить новый сервер, чтобы производительность и надежность линейно выросли.

Для упрощения, любую 2-контроллерную СХД всегда можно представить в виде кластера из двух серверов. Каждый сервер имеет свой набор CPU/ASIC, RAM, SSD/NVMe для ОС. Nutanix не ограничивается двумя контроллерами и может масштабироваться до очень больших размеров. Добавление узлов/контролеров линейно повышают производительность и надежность всей системы.

Nutanix в качестве СХД

Nutanix может быть использован в качестве внешней СХД с доступом по iSCSI и NFS/SMB. В этом случае, ВМ на Nutanix не будет, серверы могут быть однопроцессорными, с небольшим кол-вом оперативной памяти (достаточной для работы CVM). Можно установить во все доступные слоты SSD и получить мульти-контроллерную AllFlash СХД.

Бесплатный гипервизор Nutanix позволяет отказаться от VMWare

Nutanix предлагает свой гипервизор AHV, который бесплатен и в полной мере раскрывает функционал продукта. vSphere стоит денег и обрезает некоторые функции управления Nutanix. При использовании vSphere заказчики получают 2 разные консоли. В обеих можно создавать ВМ и снапшоты. Но в Nutanix Prism вы управляете дисковой подсистемой, без сети. А в vSphere Client управляете сетью, при этом ничего не зная о стеке хранения (диски прокидываются напрямую в CVM, минуя гипервизор). По опыту эксплуатации различных систем, можно сказать, что это довольно неудобно. Обычно vSphere ставится, когда нет иного выхода, например, использование VMware Horizon, который работает только поверх ESXi.

Nutanix и CBS

Для себя в компании CBS мы не так давно определили (собирали статистику и отзывы заказчиков), что Nutanix это лучшее решение на рынке на сегодняшний день и в первую очередь предлагаем именно его, если цена сопоставима.

Если возникнут какие-то уточнения или вопросы, то готовы обсудить.

Список литературы
  1. Стивен Пойтрас. Библия Nutanix.
  2. Гиперконвергентные решения Nutanix
Возможно, вас заинтересует
  1. Сервисы ASA
  2. Сетевые оверлейные технологии для ЦОД. Часть 1
  3. Ограничение скорости передачи трафика. Policer или shaper, что использовать в сети?
  4. Сетевые оверлейные технологии: OTV, LISP и итоги. Часть 3
  5. Межсетевой экран NGFW Ideco UTM