Призывы превращать данные в ценный актив сегодня очень популярны. Эта задача актуальна для многих компаний, но каждая решает ее по-своему. С чего следует начать и к чему эти усилия могут привести — такие вопросы обсуждали участники одной из сессий форума «BIG DATA 2020 ОНЛАЙН: данные в основе цифровой экономики», проведенного издательством «Открытые системы» 4 июня. (О содержании пленарной сессии форума см. также «BIG DATA 2020 ОНЛАЙН: данные для государства и бизнеса»; гибкие и эффективные инструменты для работы с большими данными, в которых нуждается мир «после карантина» — в статье «BIG DATA 2020 ОНЛАЙН»: платформы данных посткризисной эпохи».)
«Сейчас самое актуальное время для создания стратегии данных. Впервые в истории данные стали важнее самих технологий», — подчеркнул Сергей Одинцов, менеджер департамента бизнес-консультирования Центра прикладного анализа данных PwC в России. Ни для кого не секрет, что в основе цифровой трансформации лежат те самые данные, которые накоплены в компании. А если нет нужных данных, причем качественных и актуальных, то и о трансформации речь идти не может.
Стратегия данных подразумевает изменения по восьми ключевым направлениям — от архитектуры и качества данных до вопросов культуры и ответственности. Иногда кажется, что реализовать необходимые изменения довольно просто, но это не так — каждое из них требует глубокой проработки. На этом пути много сложностей и барьеров — так сложилось исторически. Компании просто не хотят менять свои методы работы.
Как напомнил Егор Осипов, руководитель направления Big Data компании «Крок», успех любого проекта во многом определяется мотивами руководства компании. В случае больших данных, как правило, речь идет о трех ситуациях: желание «быть в тренде» и иметь модную технологию; модернизация существующего решения; осознанное желание принести пользу бизнесу. С первой из них, к счастью, приходится встречаться все реже — она была характерна для ранних стадий развития рынка. Осипов рассказал о выборе подходов в некоторых типичных ситуациях. В любом случае важно, чтобы заказчик осознанно относился к реализации проекта, иначе она будет идти тяжело.
«Обмен данными становится трендом. Чем больше компании используют алгоритмы анализа данных, тем более востребованными становятся внешние данные», — утверждает Денис Афанасьев, директор центра компетенции больших данных и искусственного интеллекта ЛАНИТ.
Таким образом, чем «умнее» становятся компании, тем больше им нужно данных. С другой стороны, обмену данными мешают барьеры — как законодательные, так и корпоративные, связанные с потерей знаний о клиентах. Один из методов их преодоления — поиск посредника, организующего устраивающий все стороны обмен.
Юлия Богачева, директор по управлению и анализу данных Qiwi, поделилась опытом трансформации нескольких компаний в data-driven company (компанию, управляемую на основе анализа данных). Для обозначения процесса перехода она использовала термин «датафикация».
Каждый такой проект — уникальная история, но, тем не менее, существуют несколько типичных схем. Первая из них — датафикация сверху, когда глава компании, прочитав книгу или посетив ИТ-форум, решает, что ему нужен CDO, чтобы эффективнее использовать данные внутри компании. Так появляется новый руководитель с задачей научить сотрудников работать по-новому. Датафикация сверху хорошо работает в вертикальных иерархических структурах. И здесь ключевой фактор успеха — наличие KPI по поддержке этого процесса у других руководителей.
Второй возможный вариант — датафикация снизу. В больших организациях всегда есть функционал по работе с данными: финансы, маркетинг, оценка рисков. В таких подразделениях появляются команды, занимающиеся управлением данными и претендующие на роль «офиса CDO». Датафикация снизу хороша при наличии различных линий бизнеса с малопересекающимися данными.
Большие данные в безопасности, образовании и HR
Кибермошенники не преминули воспользоваться ситуацией пандемии. Многократно обкатанные схемы и в период паники оказались эффективными: вновь пошли в ход качественно выполненные поддельные рассылки, стали эксплуатироваться темы пропусков, масок и медицинского обслуживания. Как с помощью больших данных можно противодействовать таким манипуляциям, рассказал Павел Крылов, руководитель направления по защите от онлайн-мошенничества Group-IB. Решения компании позволяют обнаруживать подобные виды мошенничества. Можно видеть, с каких устройств и из каких локаций производится вход, и выявлять явно сомнительные действия — например, когда с одного устройства осуществляется доступ ко множеству учетных записей.
Павел Крылов: «Большие данные помогают отследить злоумышленника, даже если он осторожен и пытается скрываться» |
«Мы давно занимаемся киберразведкой, следим за мошенниками с помощью различных средств, храним историю использования IP-адресов. Все вместе помогает отследить злоумышленника, даже если он осторожен и пытается скрываться», — пояснил Крылов.
Как привлечь наиболее талантливых абитуриентов и помочь им сделать правильный выбор? Самый очевидный ответ — искать в социальных сетях «цифровой след» абитуриентов. Такой проект трудно реализовать в одиночку, однако он оказался под силу Университетскому консорциуму исследователей больших данных. Консорциум объединяет более 20 университетов, в которых созданы лаборатории прикладного анализа данных. В ходе своей работы они пытаются выявить проблемы университетов, которые могут быть решены с помощью анализа больших данных. Работу по поиску перспективных абитуриентов решили начать с Томского государственного университета.
«У школьников полностью отсутствует понимание того, как могут сложиться их карьерные пути в том или ином вузе, им нужна помощь. Через соцсети мы попытались идентифицировать потенциальных абитуриентов ТГУ», — рассказал Михаил Мягков, председатель Университетского консорциума исследователей больших данных. Ученые анализировали сообщества, на которые были подписаны школьники. Определив интересы подростка, ему предлагали поступать в вуз для обучения по тому или иному направлению. Усилия принесли результат: университету удалось набрать наиболее мотивированных студентов. По итогам первого курса, число отчислений снизилось вдвое, количество троечников — на треть. Далее проект планируется расширить до создания цифрового следа выпускников.
Николай Тржаскал, директор по развитию Центра искусственного интеллекта МТС, поделился опытом построения «дополненного интеллекта» в функции HR. В МТС работают более 65 тыс. человек, поэтому для компании очень важен процесс поиска кандидатов на вакансии. А цифровая трансформация HR рассматривается как для повышения эффективности собственных процессов, так и для профессионального роста сотрудников и их развития.
Работы начались с задачи поиска «идеального кандидата» для работы в розничной сети МТС. Это подтолкнуло к более глубокому изучению проблем в области HR. В 2019 году ситуация на рынке была стабильной и основные силы кадровых служб были направлены на улучшение опыта сотрудников. Однако при этом всегда существовала проблема субъективности оценки персонала: около трети проектов на базе искусственного интеллекта в HR были ориентированы именно на ее решение.
Но три месяца пандемии кардинально поменяли рынок труда. Сейчас вопросы эффективности работы HR выходят на первый план. Главным образом это касается автоматизации процессов и их дополнения интеллектуальными компонентами, а на более длинном горизонте — вопросов принятия решений и даже автономной работы.
Уже сегодня можно полностью автоматизировать подбор массового персонала — такие проекты существуют. Далее мы увидим, как искусственный интеллект все больше расширяет возможности сотрудника, повышая его эффективность.