Nutanix HCI - альтернатива классической SAN архитектуре
- 13.02.2024
- 281
Автор
Иван Первицкий (NCSE, VCP, MCSE)
Ведущий системный инженер
Оглавление
- Высокая отказоустойчивость Nutanix
- Простота управления
- Nutanix работает на любом железе
- Узкое место традиционных СХД
- Надежность хранения данных
- Высокая скорость восстановления утерянных данных
- Легкость масштабирования кластера на Nutanix
- Nutanix в качестве СХД
- Бесплатный гипервизор Nutanix позволяет отказаться от VMWare
- Nutanix и CBS
Высокая отказоустойчивость Nutanix
Если в общем о гиперконвергенции (HCI). Существует всего 2 вендора, которые предлагают подобные решения корпоративного класса (нормальные по функционалу и надежности) – Nutanix HCI и VMware с продуктом vSAN.
Если сравнивать, то Nutanix смотрится выигрышнее. Меньше ручной работы, проще и быстрее переживает отказы компонент.
Суть проста: Nutanix это одна ВМ на каждом хосте. В этих ВМ вся логика по организации распределенного хранилища. Каждый блок хранится дважды или трижды и распределяется по всем узлам равномерно.
Вот скрин из презентации, где на каждом узле работает ВМ с Nutanix AOS (Acropolis Operating System) и службой управления Prism. Работает ВМ на собственном гипервизоре Nutanix – Acropolis Hypervisor (AHV), но можно использовать любой популярный – ESXi или Hyper-V.
ВМ пользователя представлена на скрине четырьмя блоками ABCD. Чтение происходит локально с той ноды, где запущена ВМ для достижения наибольшей производительности. Запись идет на ту ноду, где запущена ВМ и параллельно на другие ноды для достижения отказоустойчивости. В системе это называется фактор репликации, он может быть равен 2 или 3 (на скрине RF=2). То есть каждый блок данных будет записан дважды или трижды. Поэтому минимум 50% полезного пространства отъедается под нужны RF=2 (при RF=3 доступно примерно 33%). Но стоит помнить, что серверные диски стоят куда дешевле, чем специализированные диски для СХД именитых вендоров (для того же 3PAR или Primera стоимость одного HDD в канале HPE доходила до 10-15к USD, не говоря уже о SSD).
При отказе первой ноды на скрине, произойдет самое обычное событие HA (High Availability). Все данные есть на других нодах. ВМ сразу начнет стартовать на ноде 2 (к примеру), чтение блоков BC и запись всех новых блоков будет идти локально. А чтение блоков AD будет идти какое-то время по сети с ноды 3. Параллельно блоки AD будут скопированы на ноду 2, после чего начнется проверка и обеспечение фактора репликации –блоки BC будут скопированы на ноду 3.
Простота управления
Такой подход сильно снижает область обслуживания и траблшутинга всех систем. Всего одна консоль Prism (причем в отказоустойчивом варианте, на каждой ноде свой инстанс Prism) для управления всем – вычислениями, ВМ, стораджами и сетью, вместо отдельной консоли vCenter, ESXi, Storage Management, SAN Switch Management.
При этом интерфейс Prism можно освоить за неделю в полной мере, а какие-то нечастые задачи по восстановлению работоспособности ноды/диска решаются в пару кликов. То же справедливо и для добавления новых ресурсов.
Также хотел от себя добавить несколько слов про HCI в целом и Nutanix в частности, а также поделиться полезными ресурсами на эту тему.
Вот некоторые тезисы:
Nutanix работает на любом железе
Nutanix это только софт, ему фактически все равно на каком железе работать. Для себя они выбрали американскую версию Supermicro в качестве «родного» аппаратного решения и продают его у себя в канале. Для всех остальных вендоров железо считается отдельно, а софт отдельно. Мы предлагаем использовать сертифицированные серверы Lenovo HX, которые оптимизированы специально для работы Nutanix HCI.
Узкое место традиционных СХД
В традиционных СХД (та же Dell ME, HPE MSA, HPE Nimble) только 2 контроллера. Кэш на запись небольшой. Один том обслуживается только одним контроллером (ассиметричный Active-Active). Непрогнозируемая нагрузка на SAN сеть и синдром "шумного соседа" (когда одна ВМ мешает работать остальным, отъедая весь кэш и генерируя высокие очереди. Особенно критично для VDI и терминалов). При отказе одного контроллера, кэш на запись отключается на оставшемся контроллере, и деградация производительности становится ощутима.
В Nutanix каждый сервер по сути является контроллером СХД. Кэш на запись в каждом узле изменяется динамически и может достигать 400ГБ на сервер. Каждый узел обслуживает каждый том (концепция Mesh-Active). Помимо этого, в Nutanix используется механизм Data Locality при котором ВМ физически размещены на локальных дисках тех узлов, чьи ресурсы они используют (RAM, CPU). В случае Data Locality чтение идет быстрее, чем в других системах HCI (Azure Stack, vSAN) и др.
Надежность хранения данных
Полезное пространство в Nutanix всегда считается с запасом. Абсолютно каждый блок данных в системе дублируется дважды (при RF=2, минимум 3 ноды) или трижды при (RF=3, минимум 5 нод).
В традиционных системах хранения данных, блок пишется единожды и данные фактически защищены дублированием контроллеров и RAID массивами.
Высокая скорость восстановления утерянных данных
В системе Nutanix нет RAID, который при операциях rebuild всегда дает ощутимую потерю производительности и, что более важно, надежности:
- RAID5 при ребилде читает со всех дисков и пишет на 1. Если потеряется второй диск в этот момент, то все данные на массиве будут потеряны;
- RAID10. Вроде и быстр и надежен, но отказ двух дисков из одной группы RAID1 массив не переживет и все данные будут потеряны.
Легкость масштабирования кластера на Nutanix
Любой апгрейд СХД – это добавление полок расширения. Но что делать, если закончилась производительность на контроллерах. К примеру, весь кэш утилизирован другими приложениями и добавление еще одного приложения приведет к перестройке кэша и деградации производительности существующих сервисов.
В Nutanix вам достаточно добавить новый сервер, чтобы производительность и надежность линейно выросли.
Для упрощения, любую 2-контроллерную СХД всегда можно представить в виде кластера из двух серверов. Каждый сервер имеет свой набор CPU/ASIC, RAM, SSD/NVMe для ОС. Nutanix не ограничивается двумя контроллерами и может масштабироваться до очень больших размеров. Добавление узлов/контролеров линейно повышают производительность и надежность всей системы.
Nutanix в качестве СХД
Nutanix может быть использован в качестве внешней СХД с доступом по iSCSI и NFS/SMB. В этом случае, ВМ на Nutanix не будет, серверы могут быть однопроцессорными, с небольшим кол-вом оперативной памяти (достаточной для работы CVM). Можно установить во все доступные слоты SSD и получить мульти-контроллерную AllFlash СХД.
Бесплатный гипервизор Nutanix позволяет отказаться от VMWare
Nutanix предлагает свой гипервизор AHV, который бесплатен и в полной мере раскрывает функционал продукта. vSphere стоит денег и обрезает некоторые функции управления Nutanix. При использовании vSphere заказчики получают 2 разные консоли. В обеих можно создавать ВМ и снапшоты. Но в Nutanix Prism вы управляете дисковой подсистемой, без сети. А в vSphere Client управляете сетью, при этом ничего не зная о стеке хранения (диски прокидываются напрямую в CVM, минуя гипервизор). По опыту эксплуатации различных систем, можно сказать, что это довольно неудобно. Обычно vSphere ставится, когда нет иного выхода, например, использование VMware Horizon, который работает только поверх ESXi.
Nutanix и CBS
Для себя в компании CBS мы не так давно определили (собирали статистику и отзывы заказчиков), что Nutanix это лучшее решение на рынке на сегодняшний день и в первую очередь предлагаем именно его, если цена сопоставима.
Если возникнут какие-то уточнения или вопросы, то готовы обсудить.
Наши услуги Список литературы- Стивен Пойтрас. Библия Nutanix.
- Гиперконвергентные решения Nutanix