Проводя инвестиции в средства хранения, предприятия отдают предпочтение уже не унаследованным архитектурам, а программно-конфигурируемым системам, которые обеспечивают более высокую гибкость, упрощают снабжение и снижают административные расходы. Гиперконвергентные системы – объединяющие в едином виртуальном решении средства хранения, вычислительные ресурсы и сетевую функциональность, – вне всякого сомнения, находятся в их поле зрения.
Предприятия, проявляющие интерес к гиперконвергентным системам и рассматривающие их в качестве потенциальной замены унаследованных систем хранения категорий SAN (storage area network — «сеть хранения») и NAS (network attached storage — «подключаемое к сети устройство хранения»), побуждают крупных производителей систем хранения проводить свою гиперконвергентную игру, приобретая стартапы и выстраивая собственные предложения.
Усиление внимания со стороны потенциальных клиентов возымело свое действие: крупнейшим сегментом программно-конфигурируемых средств хранения становится гиперконвергентная инфраструктура, которая в ближайшие пять лет обещает среднегодовой рост на уровне 26,6%, а ее обороты, по прогнозам исследовательской компании IDC, в 2021 году достигнут 7,15 млрд долл.
«Гиперконвергентная инфраструктура является самым динамичным рынком во всем многомиллиардном сегменте хранения», – отметил директор IDC по исследованиям систем хранения Эрик Бердженер.
Шумиха вокруг гиперконвергентности
Гиперконвергентные платформы, как правило, работают на серверах массовой архитектуры и включают в свой состав гипервизор для виртуальных вычислений, программно-конфигурируемые системы хранения (Software Defined Storage, SDS) и средства виртуализации сетевых функций (Network Function Virtualization, NFV). Множество узлов объединены в кластеры и формируют пулы разделяемых вычислительных ресурсов и ресурсов хранения, которые спроектированы из расчета максимального удобства потребления – компании могут начинать с малого и наращивать потребление по мере необходимости. Использование стандартного оборудования позволяет сформировать инфраструктуру, которая с точки зрения управления оказывается более простой и гибкой по сравнению с традиционной корпоративной инфраструктурой хранения.
Основной причиной широкого распространения гиперконвергентной инфраструктуры является простота ее расширения. «Если ваш бизнес растет, и пришла пора расширяться, вы просто покупаете еще один x86-сервер с дополнительными средствами хранения и подключаетесь к остальной гиперконвергентной инфраструктуре, а за сбалансированность нагрузки отвечает уже программное обеспечение, – подчеркнул Бердженер. – Все очень просто, и это можно рассматривать как обычную единичную покупку».
Изначально гиперконвергентные системы были предназначены для инфраструктуры виртуальных рабочих столов и прочих систем общего назначения с предсказуемым потреблением ресурсов. Но со временем они превратились в специализированные решения для инфраструктуры виртуальных рабочих столов и масштабируемые платформы для баз данных, коммерческих приложений, средств взаимодействия, файловых сервисов и сервисов печати и т.д.
Основными потребителями гиперконвергентных систем на сегодняшний день являются малые и средние предприятия, но технологии совершенствуются, и уже в ближайшее время ситуация может измениться. Внимание крупных компаний привлекает, в частности, возможность независимого масштабирования вычислительных ресурсов и ресурсов хранения.
«Один из недостатков гиперконвергентной инфраструктуры, покупаемой в виде единого узла, заключается в том, что вы не можете адаптировать к своим потребностям производительность и емкость хранения независимо друг от друга, – указал Бердженер. – В небольших средах несоответствие производительности, как правило, не имеет особого значения. Но в крупной среде для того, чтобы получить желаемую емкость, организации приходится порой тратить на вычислительные компоненты гораздо больше, чем она хочет».
Решение заключается в том, чтобы позволить компаниям смещать гиперконвергентной инфраструктуры в сторону дезагрегированных моделей, не требующих миграции данных при изменении рабочей нагрузки.
«В крупных средах хорошо иметь возможность независимого масштабирования вычислительных ресурсов и ресурсов хранения, – указал Бердженер. – При использовании дезагрегированной модели в случае увеличения потребностей в емкости хранения вы можете получить ее, не оплачивая дополнительно увеличение вычислительных ресурсов. В 2018 году поставщики позволят клиентам настраивать свою гиперконвергентную инфраструктуру в рамках традиционной гиперконвергентной модели или дезагрегированной модели хранения. Клиенты растут, и поставщики не хотят терять их».
NVMe over Fabrics
Еще одним существенным нововведением в мире гиперконвергентной инфраструктуры является возможность создания гиперконвергентного решения с использованием технологии NVMe over Fabrics (Non-Volatile Memory Express — интерфейс для подключения устройств хранения, оптимизированный под скоростные накопители с энергонезависимой памятью. — Прим. ред.). В большинстве существующих гиперконвергентных систем кластерные узлы подключаются через Ethernet, что порождает вопросы локальности данных, поскольку предприятия пытаются создавать собственные гиперконвергентные среды. «Это одна из причин, сдерживающих дальнейшее распространение гиперконвергентных решений, – указал Бердженер. – Когда набор данных оказывается слишком велик для размещения его на одном узле, и для получения доступа к данным приходится переходить на другой узел, это приводит к весьма существенным задержкам».
Низкие задержки и высокая пропускная способность NVMe over Fabrics способствуют значительному улучшению ситуации.
«Если вы можете подключить узлы гиперконвергентной инфраструктуры через NVMe over Fabrics и использовать RDMA – удаленный прямой доступ к памяти – задержка не должна превышать 5 микросекунд независимо от того, находятся ли данные на том же самом узле или происходит обращение к другому узлу, – подчеркнул Бердженер. – А для большой схемы 5 микросекунд – это ничто».
Подключения NVMe могли бы снять вопросы, связанные с локальностью данных, если предположить, что все находится в той же самой кампусной среде. Устранение задержек откроет возможность использования гиперконвергентной инфраструктуры с большими наборами данных, что должно способствовать привлечению крупных компаний.
«Две причины, по которым крупные предприятия не хотели покупать гиперконвергентную инфраструктуру в прошлом, уже устранены благодаря дезагрегированному подходу и NVMe over Fabrics, – пояснил Бердженер. – А это значит, что среды с большими наборами данных могут функционировать в рамках этой архитектуры более эффективно».