Чарли Джанкарло, генеральный директор компании, рассказал о том, как увеличить производительность приложений с помощью дата-центричных систем хранения и избежать простоев, оформив подписку на сервисы Pure.
Год назад Чарли Джанкарло встал во главе компании Pure Storage, которая в 2018 финансовом году впервые вышла на миллиардный оборот. Перед приходом в Pure Storage Джанкарло занимал пост управляющего директора и старшего советника инвестиционной компании Silver Lake Partners, а еще раньше находился на руководящих позициях в Cisco.
В беседе с Network World Джанкарло рассказал о том, как деятельность Pure способствует продвижению отрасли хранения данных вперед и как приобретенный в Cisco опыт помогает ему в его новой деятельности.
По его словам, дата-центричная (data-centric) архитектура в видении Pure – это сочетание простоты устройства хранения, подключаемого напрямую, с масштабируемостью и устойчивостью сетевых средств хранения. В конечном итоге развитие этого подхода приведет к тому, что использование разных уровней хранения данных себя изживет.
Джанкарло рассказал также о судьбе накопителей на магнитных дисках (применительно к холодному хранению), о важности NVMe (эта технология позволяет еще эффективнее использовать флеш-накопители) и об отличительных чертах сервисов хранения Evergreen, оплачиваемых с учетом реального потребления, – никаких замен старых систем на новые, обновление проводится постепенно.
- Со временем корпоративные системы хранения стали восприниматься как что-то очень скучное. Меняется ли ситуация? Становится ли отрасль хранения более инновационной?
В системе всегда есть узкое место, сдерживающее дальнейший прогресс в вычислениях, и я думаю, что в последнее десятилетие, сопровождавшееся резким ростом объема данных, таким узким местом стали средства управления данными. Технологии просто не поспевали за потребностями. Сейчас мы наконец видим реальные подвижки в сфере хранения. И это внушает оптимизм. Появление узких мест — это ведь и поиск новых возможностей.
- Что бы вы могли отметить за первый год своего пребывания в Pure Storage? Как развивается компания?
Думаю, результаты говорят сами за себя. В прошлом году средние темпы роста у нас достигли 40%. Мы представили ряд отличных новых продуктов, которые продвигаются очень хорошо, и продолжаем занимать на рынке ведущее положение с точки зрения совершенствования новых технологий. Это говорит об общем уровне компании. Конечно, многое было сделано еще до того, как я пришел сюда. Рассуждать о моих реальных достижениях пока слишком рано. Но я увидел, что у компании есть большой потенциал. Из средней она трансформировалась в крупную, а это требует смены порядка ведения бизнеса. Надеюсь, что мне удастся помочь ей перейти на следующую стадию. Нужно увязать этот процесс со способами ведения дел с партнерами, с масштабированием продаж, развитием организации и поиском новых возможностей для бизнеса.
- В мае Pure Storage представила свое видение дата-центричной архитектуры, обеспечивающей гибкость и быстроту корпоративных настроек. Можете ли вы пояснить суть дата-центричной архитектуры? Что она влечет за собой с технической точки зрения?
Мне хотелось бы вернуться к тому, как клиенты проектируют свою среду, рассказать о появлении возможности ее модифицировать, а также о том, почему ее необходимо модифицировать.
Конечно, в идеале хотелось бы щелкнуть пальцами и, как по волшебству, получить сверхмощный процессор, кооторый бы со скоростью света обращался к системе хранения, находящейся в непосредственной близости от него. Это была бы очень простая и рациональная архитектура. Еще лет 10-15 назад самым быстрым соединением была технология Gigabit Ethernet. Емкость дисков не превышала 1 Тбайт, и мы использовали распределенные процессоры.
Чтобы решать сложнейшие вычислительные задачи, нам по-прежнему нужно много процессоров, и в этом смысле ничего не изменилось. Но изменилось все остальное.
Сетевые соединения работают уже на скоростях 100 Гбит/с с тенденцией перехода на 400 Гбит/с. Объемы данных продолжают расти стремительными темпами, не умещаясь на одном диске или твердотельном накопителе. Нужно все масштабировать. Но при высокой пропускной способности сети и высокой плотности твердотельных устройств хранения мы можем заставить все выглядеть так, будто нужные вам данные находятся рядом с процессорами.
Много лет назад стек приложений был слишком громоздким. Проектирование представляло собой очень сложный процесс. Приходилось адаптироваться к конкретной прикладной среде. У компаний имелись операционная система, связанные с нею программные средства безопасности, программное обеспечение дистанционного управления и настроенные приложения. Все было жестко привязано друг к другу. А теперь представьте, что объемы данных необходимо увеличить. Единственным способом добиться этого было горизонтальное масштабирование данных.
Сегодня мы имеем дело с гораздо более легковесными приложениями. Они находятся в виртуальной и зачастую контейнерной среде. Их можно размещать где угодно. Сами же данные остаются тяжеловесными. Когда речь идет о петабайтах данных – даже в массиве, который занимает в стойке всего 5 дюймов, – их перенос занимает очень много времени. Гораздо проще переместить приложение к данным, чем данные к приложению. Теперь, при наличии интерфейсов 100-Gigabit Ethernet, мы вполне можем сделать это.
Вот что понимается под дата-центричной архитектурой: проектирование архитектуры для обработки данных возле места их хранения, а не проектирование, предусматривающее перенос данных ближе к приложению.
Сегодня, как и много лет назад, по-прежнему приходится заботиться о постоянной репликации данных, поскольку каждому приложению нужна своя их копия. В какой-то степени это обусловлено требованиями к производительности. Делиться данными с другими приложениями при условии неизбежного снижения производительности никто не хочет. Если же данные хранятся на твердотельном накопителе, сразу несколько приложений могут обращаться к ним на максимальной скорости, гарантирующей требуемое качество обслуживания. Таким образом, разделение доступа к данным никак не отражается на других приложениях.
Это еще одна особенность дата-центричной архитектуры. Количество копий данных уменьшается. Доступ любого приложения к ним упрощается, что приводит к сокращению затрат и увеличению производительности. Это способствует также укреплению безопасности и соблюдению нормативных требований, поскольку количество копий данных в рамках предприятия уменьшается.
- Отличительной особенностью Pure является ее ценовая модель хранения, предлагаемого в качестве сервиса. Что вы можете рассказать об Evergreen Storage Service (ES2)?
Наши конкуренты рассматривают это только с точки зрения цены. На самом деле речь идет о чем-то гораздо большем. Мы обещаем клиентам, что, перейдя на нашу бизнес-модель, они получат систему хранения с постоянно обновляемым аппаратным и программным обеспечением. У них никогда не возникнет необходимости в переносе своих данных из этой системы. Наши конкуренты не предлагают такого, поскольку они не готовы проводить непрерывное обновление. Заменять оборудование или программное обеспечение без отключения системы у них не получается. Предлагая новую модель вместо прежней, наши конкуренты вынуждают клиентов переносить свои данные. Они не могут обновить устаревшую систему хранения.
- Значит, покупая сейчас, клиент может быть уверен в том, что ему не придется задумываться о замене массива несколько лет спустя?
Совершенно верно. Мы сами выполняем все необходимые процедуры на месте. Оплатив подписку, клиент больше не должен платить ни за что. Мы будем продолжать обновлять систему до тех пор, пока действует подписка. Еще одно преимущество заключается в том, что мы не взимаем дополнительную плату за хранение одного и того же. Приведу пример. Допустим, клиент купил систему емкостью 50 Тбайт. Если через несколько лет у него возникла потребность расширить ее до 250 Тбайт, он платит только за 200 Тбайт. Уже имеющиеся 50 Тбайт не нужно оплачивать повторно.
- А насколько распространен такой сценарий? Осуществляют ли клиенты постепенный переход на системы хранения, основанные на флеш-памяти? Какова их типичная стратегия?
Мы видим все это собственными глазами. Более двух десятков наших ведущих клиентов в последующие четыре года с момента первой покупки нарастили объемы в 10-12 раз. А среднее увеличение объемов в 4-5 раз за первые два-три года характерно для всех наших клиентов.
- Не собираются ли они отказываться от дисковых накопителей?
Дисковые накопители по-прежнему будут использоваться, но мы начнем переводить их в холодные хранилища.
Мы убеждены в том, что первый и второй уровень в конечном итоге отомрут. И связано это с тем, что, как я уже говорил, есть множество приложений, которым нужно одновременно обращаться к одному и тому же хранилищу. Если у вас уже имеется так называемое хранилище первого уровня, а приложения, которым обычно присваивается второй уровень, обращаются к данным этого хранилища, не затрагивая приложения первого уровня, то лишние уровни можно убрать.
Первый и второй уровень будут переводиться на флеш-накопители по мере снижения цен на эти устройства. Холодное хранение будет перемещаться в облако, но и в облаке останется на магнитных носителях. Другими словами, оно будет дешевым и объемным.
- Давайте перейдем к энергонезависимой памяти NVMe (non-volatile memory express), которая встряхнула всю отрасль корпоративных систем хранения. Почему нам следует обратить внимание на NVMe? В чем ее преимущества?
На NVMe стоит обратить внимание хотя бы потому, что, верите вы или нет, но мы по-прежнему имеем дело с протоколами, которые разрабатывались для магнитных средств хранения. До появления NVMe протоколы доступа к устройства хранения, даже твердотельному, проектировались для магнитных средств хранения. И SCSI, и SATA, и SAS, и iSCSI проектировались в качестве последовательных интерфейсов для относительно медленных средств хранения.
Энергонезависимая память NVM (non-volatile memory) – по сути, твердотельная память. NVMe – это более современный протокол, который учитывает как доступную нам сегодня пропускную способность сетей, так и фундаментально параллельную природу твердотельных накопителей.
NVMe – параллельный способ доступа к твердотельным накопителям. И для Pure это даже более важно, чем для наших конкурентов. В большинстве наших продуктов применяется так называемая DirectFlash. Флеш-память охватывает весь спектр нашей продукции. Все наши конкуренты используют твердотельные диски (solid-state disk, SSD). Сегодня сам термин «твердотельный диск» – уже анахронизм, поскольку в этом устройстве нет диска. Здесь нет вращающихся элементов. Но SSD делает флеш-память похожей на магнитный диск. Именно поэтому и разрабатывались такие устройства. Конкуренты могут утверждать, что делают ставку на флеш, но на самом деле они всего лишь удалили из устройства магнитные диски и вставили туда флеш-накопители. Такому оборудованию присущи все ограничения протоколов, разрабатывавшихся для магнитных накопителей. Они относительно медленные, не оптимизированы для работы с флеш-памятью и по своей природе предназначены для последовательного обмена данными. В таких устройствах флеш-память не имеет параллельного интерфейса.
Устройства NVMe мы внедряем с начала прошлого года и теперь используем для доступа к флеш-накопителям интерфейс NVMe. Для нас все это играет очень важную роль. Мы можем еще эффективнее использовать флеш-память. Наши клиенты получают более высокую скорость как чтения, так и записи. Такой подход позволяет применять любой тип флеш-памяти и предлагать более экономичные решения как на потребительском рынке, так и корпоративным клиентам.
- А как насчет NVMe over Fabrics (NVMe-oF)?
NVMe over Fabrics – это высокоскоростной способ получения доступа к устройствам хранения через традиционные интерфейсы Ethernet и Fibre Channel, который имеет большое значение для нашей модели совместного хранения с ускоренным доступом.
Рассмотрим три основные способа доступа к хранению: DAS (direct attached storage), SAN и NAS. Благодаря NVMe можно свести все эти три способа к одному. Мы называем это совместным хранением с ускоренным доступом. Можно убрать DAS и вместо серверов со своими собственными дисками обращаться через интерфейс NVMe к массиву, получая ту же самую или даже более высокую производительность, чем раньше.
Совместное хранение с ускоренным доступом может вытеснить SAN с NMVe и обеспечить более высокую производительность. То же самое относится и к устройствам NAS: NVMe заставляет их работать быстрее, чем при использовании традиционных протоколов.
И наконец, NVMe over Fabrics создает параллельный интерфейс, пусть даже и через Ethernet. Эта технология позволяет осуществлять одновременный доступ сразу к нескольким дискам при выполнении операций чтения и записи, что важно для приложений искусственного интеллекта, решения аналитических задач и другой сложной и многопоточной рабочей нагрузки.
- Обращаются ли заказчики к Pure при решении каких-то конкретных задач или же их интересует более широкий, стратегический подход к хранению?
Есть разные подходы. Одни увязли в существующих средах и ищут способы улучшить то, что делают сегодня. Другие борются с возникающими новыми вызовами и переходят к решению иных задач. Они пытаются масштабировать среду приложений с помощью DAS, SAN или в среде Amazon S3. Когда мы перешли к архитектуре, ориентированной на данные (в том числе к идее исключения DAS и использования более централизованного, дата-центричного подхода), клиенты заявили: это как раз то, что нужно.
- Если ли какие-то конкретные задачи, которые способствуют продвижению вашего подхода?
Для нас очень важны области искусственного интеллекта и анализа. Клиенты поняли, что использовавшийся ранее способ управления хранением работать не будет. Все слишком медленно и зачастую слишком громоздко. Для достижения нужной производительности или хранения нужного объема данных требуется слишком много стоек с оборудованием. Одна из причин партнерства Nvidia с нами заключается в том, что они накопили очень большой опыт работы в этой сфере и пришли к выводу, что нет другой такой системы, которая обеспечила бы скорость доставки данных, позволяющую полностью загрузить их графические процессоры.
- На ваш взгляд, отсутствие у стартапа унаследованной платформы – это преимущество?
Когда мы начинали, у наших конкурентов уже был опыт, измеряемый десятилетиями. Мы же с самого первого дня сосредоточились на флеш-памяти. И специализировались только на ней. У нас не было базового программного обеспечения, не оптимизированного для флеш-памяти. Это очень важный момент, о котором упоминают не часто: наше программное обеспечение с самого начала предполагало параллельную обработку. Мы использовали параллельные потоки, чтобы одновременно обращаться сразу к нескольким частям системы хранения. Почти все наши конкуренты разрабатывали последовательные программные потоки.
- Что больше всего волнует вас на пороге своего второго года в компании?
Многое. Компания сама по себе – уже весьма увлекательная тема. Как добиться создания отличных продуктов и обеспечить поддержку клиентов? Здесь нужно действовать очень энергично. Проявлять энтузиазм, заботиться о росте. Создание великой культуры нельзя поставить на поток. И мне очень повезло в том, что я пришел в компанию с уже сложившейся культурой, ориентированной на клиентов и технологии.
Теперь необходимо сосредоточиться на дата-центричной архитектуре и продолжать думать о будущем компании. Я полагаю, что если мы сумеем реализовать задуманное и наши клиенты смогут получать более высокую отдачу от своих данных, перед нами откроется масса дополнительных возможностей.
- Крупными штрихами, чего можно ждать с точки зрения разработки продуктов? Больше, быстрее?
Конечно, быстрее, дешевле, плотнее. Это нормально. Не стоит забывать также, что мы помогаем клиентам перенести больше данных в облако. И избавиться от лишних уровней. Для наших клиентов это очень серьезные изменения.
- Какие навыки, приобретенные в Cisco, помогли вам в Pure?
Все новое – хорошо забытое старое. Когда Cisco купила Kalpana, ее квартальный оборот впервые составил 250 млн долл. И когда я пришел в Pure, продажи компании по итогам квартала тоже преодолели отметку в четверть миллиарда долларов.
В момент моего ухода из Cisco ее оборот составлял 45 млрд долл. Входя в команду руководства, я прошел весь этот путь роста, сопровождавшийся масштабными изменениями. В процессе роста я видел все изнутри. При планировании инфраструктуры компании с оборотом в 45 млрд долл. на этапе, когда ее оборот составляет 1 млрд долл., одного лишь желания недостаточно. Нужно четко представлять себе все этапы, через которые вам предстоит пройти. Имея за плечами подобный опыт, я знаю, на что следует обратить внимание. Проходя этот путь вместе с Cisco, мы наделали массу ошибок. Надеюсь, что на этот раз их число серьезно уменьшится. Теперь мы знаем, во что выливается создание целой отрасли, – начав с маршрутизаторов, мы плавно подходили к коммутаторам, IP-телефонии, Wi-Fi и т. д. Возможности компании расширялись горизонтально. В Pure нам тоже предстоит осваивать какие-то новые области, которые весьма близки, а может быть, и непосредственно связаны с тем, что мы делаем сейчас, и это очень интересно как мне, так и компании в целом.