Разные ветви управления данными сейчас находятся на разных уровнях зрелости: наряду с устоявшимися направлениями есть и те, которые только-только формируются и где есть широкий простор для развития методик и инструментов. О самых ярких тенденциях в области управления данными рассказывает Руслан Трачук, технический директор компании «Юнидата».
— Что сейчас происходит с управлением данными? Какие тенденции формируют развитие этой дисциплины?
Если брать «классическое» управление данными (Data Management), то это уже вполне сформировавшаяся дисциплина, ее развитие продолжается на уровне «тактики» – проработки отдельных аспектов. Если же говорить о руководстве данными (Data Governance), то это направление сейчас находится «на взлете»: оно еще не приняло свои окончательные очертания, и здесь в обозримом будущем возможны серьезные изменения в раскладе сил.
С моей точки зрения, тема управления данными сейчас начинает расслаиваться на уровни. С одной стороны, есть методики и инструменты для решения отдельных узких задач. С другой стороны, если имеется, например, конкретное озеро с большими объемами разнообразных данных, то часто бывает непонятно, каким образом выстраивать в нем управление данными, чтобы охватить всё озеро и обеспечить гармоничное встраивание в него новых объёмов данных, например, периферийных вычислений. Эти вопросы еще только предстоит решить. Возможно, для этого потребуются и новые инструменты, которых пока нет на рынке.
Похожая ситуация была, например, лет пять назад: предприятия в основном работали с небольшими наборами данных, а теперь объемы выросли, появились инструменты для больших данных, сформировались новые подходы и даже специальности, такие, например, как исследователь данных (data scientist).
Думаю, в ближайшие годы нас ждет развитие руководства данными. Сегодня это, скорее, декларация о намерениях, чем сформировавшаяся отрасль знаний. Конечно, некоторые аспекты уже реализованы, но ландшафт этой области меняется очень быстро, и многое еще только предстоит проработать. Например, в июле компания Gartner выпустила отчет, в котором заявила о новом классе инструментов – системах управления активными метаданными (Active Metadata Management System). Аналитики считают, что в ближайшие три-пять лет эти инструменты будут играть очень важную роль.
— К каким областям управления данными наиболее велик интерес у российских компаний и организаций?
Интересы и предпочтения заказчиков имеют серьезные отличия по отраслям и сегментам. В крупных компаниях и холдингах приоритетными являются задачи по управлению данными о материально-технических ресурсах и других активах. В финансовых организациях наблюдается первостепенный интерес к данным о контрагентах. Есть и достаточно общая для российских компаний тенденция – попытка совместить эти две области данных в рамках одного решения, чтобы получить всестороннее видение ситуации в бизнесе. В компаниях, связанных с производством, наблюдается также стабильный спрос на управление конструкторскими и производственными данными, в том числе промышленного Интернета вещей и АСУТП.
По нашим наблюдениям, в целом среди российских заказчиков сейчас наиболее востребовано «классическое» управление основными данными предприятия (MDM) и качество данных – без этого базиса всё остальное не имеет смысла.
— Какие показатели качества данных стремятся в первую очередь улучшить российские заказчики?
Это тоже во многом зависит от конкретного сегмента, на котором заказчики работают. Если говорить в целом, то это повышение доверия к данным.
— Есть ли интерес в России к решениям для обработки потоковых данных?
Мы встречали в своих проектах ситуации, когда используется потоковая обработка данных. Но необходимо различать инструментарий, позволяющий обрабатывать потоки данных, и сами данные, имеющие потоковую природу. В большей части случаев мы сталкивались, скорее, с применением инструментария, предназначенного для работы с большими объемами потоковых данных. Проектов, где есть «классические» потоковые данные, мы видели заметно меньше. Однако там, где они представлены, эти данные присутствуют в больших объемах. В основном такие проекты реализуются в органах власти – они сегодня генерируют просто огромные объемы данных.
— В западных продуктах для управления данными немалая часть функционала нацелена на обеспечение соответствия требованиям местных регуляторов. Актуальна ли эта проблема для российских заказчиков?
Да, проблема есть, хотя едва ли ее можно считать основной. Поддержка требований регуляторов особенно важна для организаций финансовой отрасли и госсектора: им необходимо обеспечить надлежащее хранение и доступ к конфиденциальным данным (в том числе персональным) и соблюсти прочие нормы и регламенты. В отношении данных коммерческих компаний объем требований регуляторов в целом меньше.
— Пользуются ли в России спросом облачные решения для управления данными?
Да, пользуются. На конференции, которую проводило «Яндекс.Облако», рассказывалось об опыте компании «Леруа Мерлен», которая активно реализует проекты с облачными решениями для управления данными. Надо отметить, что такими решениями в основном интересуются международные компании. Российские предприятия в силу известных причин пока относятся к облачным инструментам с осторожностью.
— Насколько хорошо покрывают потребности российских заказчиков те инструменты для управления данными, которые имеются на российском рынке?
Если говорить о продуктах отечественных разработчиков для управления данными, то их нынешнее предложение покрывает практически все аспекты. Возможно, этим продуктам не хватает конкурентоспособности. Известные ограничения на использование западного программного обеспечения, которые есть в России, заметно сузили круг технологий, которые могут выбирать наши заказчики.
Что касается продуктов для руководства данными, то в этом сегменте предложение весьма скудное. Наша компания – один из немногих российских разработчиков, которые занимаются этим направлением.
— Насколько велик интерес к российским решениям для управления данными за рубежом?
Зарубежный рынок – понятие достаточно размытое. Американский и европейский рынки отличаются высокой конкуренцией – там представлено много игроков, и выйти на них новому вендору достаточно сложно. Тем не менее, можно: в апреле мы вместе с нашим партнером – американской компанией StikeTru реализовали первый этап проекта в одной из старейших американских компаний в области недвижимости – компании Baird&Warner.
Есть также целый ряд стран на Ближнем Востоке и в Азии, где интерес к решениям MDM огромен, при этом заказчики делают свой выбор, исходя из сугубо практических критериев. Здесь мы можем вполне успешно конкурировать, поскольку предлагаем решения MDM с более выгодным соотношением цены и возможностей, чем западные вендоры.
— «Юнидата» два года подряд удостоилась внимания аналитиков Gartner. Чем вы объясняете успех?
На мой взгляд, интерес Gartner к нашей компании вызван тем, что мы одни из первых вышли на рынок с концепцией единой платформы, на базе которой строится вся наша продуктовая линейка в области управления данными и смежных областях. Такая архитектура обеспечивает эффект синергии.
Мы смогли предложить подход на основе цельной платформы, потому что мы – достаточно молодая компания, не отягощенная грузом прошлого, и стали первыми, кто начал обсуждать с Gartner преимущества такого подхода.
В отличие от нас, портфели продуктов многих западных вендоров, которые упоминаются в отчетах Gartner, формировались в течение довольно долгого времени, расширяясь в основном за счет технологий, приобретенных в ходе процессов скупки и слияния компаний. В результате их портфели зачастую представляют собой конгломерат решений. Кстати, некоторые наши западные конкуренты тоже решили вывести на рынок технологические платформы для управления данными.
— Какие направления в области управления данными получат, на ваш взгляд, наиболее активное развитие в ближайшие годы?
Как я уже сказал, будет бурно развиваться руководство данными, особенно в части озер данных и сеток данных (data mesh). Недавно познакомился с одним из проектов Сколково, участники которого озадачились поиском аномалий в озерах данных, – считаю, что это тоже очень интересное и перспективное направление, для которого пока нет готовых решений.