Как грамотно управиться с нарастающей волной данных, перейти к дата-центричному подходу в ИТ-архитектуре и стать бизнесом, направляемым данными (data-driven)? Подсказки консультантов, методологии, вдохновляющие примеры превращений производственных компаний в поставщиков цифровых услуг, выступления экспертов по нормативному регулированию персональных данных — все это на прошедшем при полном аншлаге форуме «Управление данными 2019», организованном издательством «Открытые системы».
Подсказки от KPMG
Для тех, кто занимается проектами, связанными с искусственным интеллектом, качественные данные — постоянная головная боль. В одном из ключевых докладов форума от компании KPMG, средствам избавления от этой «боли» было отведено центральное место.
KPMG рекомендует для начала навести порядок, разобравшись в мета-данных и их сущности для бизнеса. Кроме того, монетизация данных, получение выгоды от них, должны стать частью стратегии компании на уровне ее высшего руководства. Не случайно директор по данным (Chief Data Officer, CDO) обычно подчиняется непосредственно руководителю компании, иначе запускать центры монетизации данных и кросс-функциональные команды, работающие с данными, просто невозможно.
Еще один крайне важный момент — в компаниях нередко возникают своеобразные «очаги инноваций», однако знание о том, что именно в них происходит, похоронено внутри этих маленьких команд. «Пиарьте инициативы, связанные с данными, рассказывайте о них внутри компании, рассказывайте снаружи, — призвала участников форума Алена Дробышевская, директор, руководитель направления «Умные технологии» KPMG. — Иногда бывает проще услышать что-то снаружи, чем изнутри».
Бизнесу следует быть готовым к смене бизнес-модели. Одно из самых тяжелых требований для традиционных компаний — быть открытыми для новых возможностей. Им чрезвычайно трудно воспринимать информацию как актив, который можно продавать или строить продукты на его основе. Тем не менее в компании непременно должны найтись люди, которые такие вещи придумывают.
Волшебное превращение
Компании AkzoNobel повезло — такие люди у нее были, и эффект их деятельности оказался весьма неожиданным.
Пример AkzoNobel крайне любопытен. Благодаря сбору и обработке накопленных данных производитель лаков и покрытий стал еще и разработчиком программного обеспечения, и поставщиком информационных услуг. Обрастание корпусов морских судов ракушками и водорослями со временем приводит к заметному увеличению расходов на топливо, поэтому прогнозирование этих процессов пользуется спросом у владельцев судов. Идея сбора соответствующих данных принадлежала двум ученым, начавшим эту работу еще в 1972 году. С 2009 года AkzoNobel начала собирать действительно большие данные, несмотря на отсутствие понимания, как удастся их использовать, да и удастся ли вообще. В течение нескольких лет, обновлясь каждые 15 минут, в компании копились данные о 25 тыс. судов и 8 параметрах окружающей их среды. В 2015 году на рынок вышел первый программный инструмент по предсказанию потребления топлива морскими судами. Вслед за этим у лакокрасочной компании неожиданно появился спрос на ее ИТ-инструмент предсказательной аналитики со стороны портов. Теперь AkzoNobel — поставщик информационного сервиса для судов и портов, заинтересованных в информации, помогающей предотвратить занос в акваторию порта опасной микрофлоры.
Персональная неопределенность
Несмотря на то, что персональные данные не обделены вниманием законодателей, до сих пор многое остается неясным, начиная собственно с определения персональных данных и степени, до которой их следует обезличить, чтобы получить возможность использовать в коммерческих целях.
«Есть колоссальная правовая неопределенность в вопросе, кому принадлежат персональные данные, том числе те общедоступные данные, которые сам субъект ввел в оборот, — подчеркнула Александра Орехович, директор по правовым инициативам ФРИИ. — И все вопросы очень острые». Исходя из духа закона, законодатель относит личные данные к собственности самого человека, но поскольку механизм распоряжения ими не урегулирован, человек себя собственником не чувствует.
Александра Орехович: «Сохраняется колоссальная правовая неопределенность в вопросе, кому принадлежат персональные данные» |
Неудивительно, что фактический объем российского рынка данных примерно в 50 раз меньше, чем его потенциал. Но самое неприятное для бизнеса — массовое недоверие. По данным исследования Ipsos и Всемирного экономического форума, более половины пользователей готовы отозвать свои персональные данные и более не предоставлять их никому и не при каких условиях. Только 46% опрошенных готовы предоставлять персональные данные на условиях монетизации или получения преференций. Еще печальнее результат прошлогоднего опроса ВЦИОМ: 70% граждан уверены, что их данные бессовестно крадутся. По мнению Орехович, это прямое следствие правовой неопределенности и невозможности узнать, кто какие данные куда передает и с какой целью. Четкое ощущение, что данные им не принадлежат, приводит к тому, что клиенты не желают подписывать согласие на обработку персональных данных — с этой проблемой уже сегодня сталкивается малый бизнес.
Для решения этих вопросов готовится ряд поправок в действующее законодательство, в том числе по инициативе ФРИИ. «Мы считаем очень важным предоставить самому субъекту информацию о том, какие его данные обрабатываются, а также возможность их отозвать, — заявила Орехович. — Это уже существующая практика, несмотря на утверждения некоторых компаний, что это невозможно или очень дорого».
Исследование ФРИИ показало, что создание такого механизма обойдется российскому оператору персональных данных приблизительно 600 тыс. руб. — подъемная сумма, если бизнес заинтересован в вовлечении пользовательских данных в хозяйственный оборот. Это станет хорошей основой и для взаимодействия операторов, дав им возможность обогащать свои данные.
В центре ИТ-инфраструктуры
Каждая технология работы с данными эффективна в своей нише: реляционные СУБД хороши для хранения временных рядов и транзакционных данных, базы NoSQL для неструктурированых документов, а технологии Big Data позволяют хранить большие объемы редко изменяющихся данных. «Нужно взять лучшее от каждого продукта и объединить в целостную логическую структуру, обеспечив связность, быстроту обработки, гибкое управление структурой и так далее», — говорит Сергей Горшков, директор компании «ТриниДата». По его мнению, на дата-центрический подход в построении ИТ-инфраструктуры следует переходить эволюционно. Первый шаг на этом пути — создание логической витрины данных, второй — построение хранилища данных, с которым будут работать приложения. Ключевым компонентом такой архитектуры для управления корпоративными данными являются онтологические модели, позволяющие хранить не только структуру данных, но и правила их обработки.
В мире интерес к решениям по управлению данными на основе онтологий и дисциплине «граф знаний» (Knowledge Graph) бурно растет, этот рынок стремительно развивается. В России, по словам Горшкова, тоже ожидается рост спроса на подобные решения не менее 100% в год. Онтология позволяет справится с описанием структуры данных любой степени сложности (десятков тысяч сущностей и связей между ними) и выстроить структуру данных на основе концептуальных представлений бизнес-пользователей, сделав ее интуитивно понятной.
Воплощением этой идеи стала платформа «АрхиГраф» — связующее ПО для доступа к данным, которая в совокупности с другими компонентами образует инфраструктурный слой единого корпоративного хранилища данных. «Нашей задачей было совместить мощь онтологий и лучшие существующие технологические наработки», — пояснил Горшков. «АрхиГраф» позволяет организовать логическую витрину данных для доступа к информации из унаследованных систем и построить кластер мультимодельного хранения данных, в котором начнет копится последующая информация.
На краю бизнеса
По прогнозам аналитиков, уже к 2022 году три четверти корпоративных данных будут создаваться и обрабатываться за пределами ЦОД и облаков — периферийными, или граничными (edge) решениями. Предполагается, что граничные вычисления не только освободят корпоративные сети от необходимости передавать большие объемы данных и позволят оптимизировать инфраструктуру обработки неструктурированных данных, но и существенно повлияют на решения по управлению данными.
Как сообщил технический консультант компании Atos Алексей Коваленя, некоторые консалтинговые компании предлагают свыше ста сценариев потенциального использования граничных вычислений. К примеру, первичная обработка данных «на месте» актуальна для систем компьютерного зрения, аналитики в реальном времени, а также обеспечения безопасности на границе сети. Специально для периферийных вычислений Atos выпустила в апреле 2019 года однопроцессорный сервер BullSequanna Edge с достаточно широким температурным диапазоном, в который можно поставить два дополнительных графических процессора для решения задач искусственного интеллекта. Сервер предназначен для работы вне ЦОДа, поближе к источнику данных. В компании Maersk, занимающейся морскими контейнерными перевозками, в течение трех месяцев тестировали BullSequanna Edge в комплексе с программным обеспечением Seimence Marine для Промышленного интернета. Это позволило добиться экономии топлива и улучшения экологических показателей.
Бизнес, движимый данными
Форум «Управление данными 2019» — не только концептуальные доклады и практические выступления, но и рабочая площадка для встреч с потенциальными партнерами и создания новых деловых связей. Так, Андрей Коньшин, руководитель проектов клиентского сервиса «МегаФон», пригласил к сотрудничеству и проведению пилотных проектов ИТ-компании, занимающиеся большими данными. В «МегаФоне» сегодня активно развивают инструменты на основе искусственного интеллекта: виртуальных голосовых помощников, речевую аналитику и роботов, продающих услуги.
Важнейшую роль для увеличения доли data-driven бизнеса в российской экономике будет играть наличие развитой методологии. В компании «Юнидата» завершают научное редактирование первого русского издания методологии, сформированной Международной ассоциацией по управлению данными (DAMA) — DMBOK 2.0. «Это книга, которую надо прочесть всем», — рекомендует генеральный директор «Юнидата» Сергей Кузнецов. Выход издания в свет ожидается в ноябре 2019 года.