Коммерческие или свободные? SQL или noSQL?..

Главному редактору журнала «Открытые системы» Дмитрию Волкову удалось собрать на одной площадке разработчиков, поставщиков и пользователей многих популярных современных коммерческих и свободных СУБД


14:19 09.12.2016   |   6097 |  Наталья Дубова |  «Открытые системы»

Рубрика Индустрия



На конференции «Технологии баз данных» доминировали решения «эпохи пост-SQL», но представители традиционных архитектур смогли достойно им оппонировать.

Как продемонстрировали доклады практической конференции «Технологии баз данных», организованной журналом «Открытые системы», новые архитектуры СУБД находят широкое применение, но обращение к ним обычно диктуется спецификой определенных задач. Так, например, своим появлением на свет столбцовая СУБД Clickhouse, разработка «Яндекса», обязана потребностям сервиса «Яндекс.Метрика», для которого были необходимы гибкие инструменты кастомизации отчетов и очень высокая скорость обработки данных. Не найдя нужных инструментов в доступных платформах, специалисты компании сделали собственную систему, возможности и удобство которой быстро оценили во многих отделах «Яндекса». После чего создатели системы решили «осчастливить» остальной мир – Clickhouse была выпущена в открытых кодах по лицензии Apache 2.0, которая открывает максимально широкие возможности использования.

Разработчик Clickhouse Алексей Миловидов подчеркнул, что при многочисленных достоинствах система имеет объективные ограничения: предназначенная для обработки больших объемов мелкогранулированных, хорошо структурированных и неизменяемых данных, Clickhouse не рассчитана на транзакционные задачи или обработку документов, не может служить платформой для озера данных и т. д. Ее ниши – это, например, веб-аналитика или анализ посещений сайтов (click stream).

Подчас приходится использовать даже несколько баз данных NoSQL, чтобы получить оптимальную поддержку для разных классов нагрузок. Так поступили, например, в компании Data-Centric Alliance: в основе ее системы управления данными для таргетирования онлайн-рекламы Facetz.DCA лежат четыре СУБД – Redis, MongoDB, Aerospike и Hbase. Каждая из них, как пояснил разработчик DCA Артем Ведерников, оказалась наиболее удачным выбором для реализации конкретного сценария доступа к данным о почти 600 млн анонимных интернет-пользователей, с которыми работает система.

«Под капотом» автомобильного онлайн-аукциона CarPrice тоже оказалось не одно решение для хранения и обработки данных. Руководитель отдела разработки CarPrice Юрий Буйлов рассказал, что использование нескольких инструментов – реляционной MySQL, нереляционной Redis и Go, базы данных, рассчитанной на обработку в памяти, – позволяет добиваться максимальной скорости и эффективности множества традиционных и онлайн-сервисов, из которых состоит аукцион, и реализовывать весь процесс продажи автомобиля за полчаса.

Открытой СУБД MySQL и ее клонам было посвящено несколько выступлений на конференции. Так, Света Смирнова из компании Percona, опытный специалист по технической поддержке MySQL, поделилась с аудиторией профессиональными секретами отладки производительности этой СУБД на разных уровнях – от запросов до оборудования. Разработчик компании MariaDB Сергей Петруня рассказал о возможностях репликации в новых версиях MySQL и MariaDB. Адаптация MySQL и нескольких других платформ для работы с данными к архитектуре российского процессорного семейства «Эльбрус» стала предметом доклада Сергея Королева из компании МЦСТ.

На волне импортозамещения интерес отечественных заказчиков к открытым базам данных по понятным причинам растет. Однако эти решения, как правило, относятся к разряду нишевых и не готовы выступить в качестве платформы для корпоративных управляющих систем, уверен Марк Ривкин, руководитель группы баз данных технологического консалтинга Oracle СНГ. По его мнению, требования предприятий к доступности, безопасности, масштабируемости и удобству использования могут удовлетворить только коммерческие СУБД «большой тройки» мировых производителей – IBM, Microsoft, Oracle. Ривкин подробно остановился на основных тенденциях развития таких систем, проиллюстрировав их, естественно, примерами новых и будущих возможностей СУБД Oracle. Среди факторов, выгодно отличающих коммерческую универсальную СУБД от специализированных свободных, он выделил следующие: способность к самоуправлению и самолечению, поддержка разнообразных типов нагрузок, механизмы работы с Большими Данными, специальные инструменты для обеспечения безопасности, архитектура максимальной доступности – система мер, которая позволяет защищаться от различных сбоев, а также возможность предложить заказчику машину баз данных, представляющую собой специализированный сервер, ускоряющий как транзакционную, так и аналитическую обработку.

Перспективными для коммерческих СУБД технологиями Ривкин назвал обработку данных в памяти, реализацию в процессоре отдельных команд, а в будущем – всей логики СУБД (что по силам только тем производителям, которые наряду с ПО баз данных выпускают аппаратные системы), облачную модель DBaaS («база данных как сервис»).

С характеристикой «нишевой» в отношении системы PosgreSQL не согласился Иван Панченко из Postgres Professional – российской компании, которая занимается продвижением этой открытой СУБД и разработкой бизнес-решений на ее базе. В частности, он рассказал об успешной миграции на PosgreSQL системы документооборота правительства Московской области. По словам Панченко, заказчика в данном проекте меньше всего волновал «политический» аспект использования платформы западного вендора. Основными аргументами в пользу перехода на открытое ПО были снижение лицензионных затрат, свобода и независимость от определенного поставщика, а на выбор конкретного решения повлияли масштабируемость и отказоустойчивость системы, а также наличие профессиональной команды поддержки в России.

Научные аспекты применения различных платформ баз данных нашли отражение в докладах Максима Губина из Томского политехнического университета (разработка базы знаний современного научного эксперимента), Дмитрия Игнатова из НИУ ВШЭ (обнаружение знаний в базах данных с помощью мультимодальной кластеризации), Виктора Китова из МГУ (эффективная реализация алгоритма бустинга — одного из наиболее популярных методов прогнозирования в машинном обучении).


Теги: Open Source СУБД Яндекс Oracle Импортозамещение PostgreSQL MySQL
На ту же тему: