Еще в XVII веке Джон Драйден писал: «Жаждущему найти жемчужину придется нырнуть глубже». Эти слова прекрасно описывают суть аналитики данных, несмотря на то что автор и представить не мог при жизни что-либо подобное. Рассказываем, насколько глубоко компаниям нужно погружаться в аналитику данных в поисках необходимой информации.
В зависимости от потребностей своего бизнеса компании выбирают, насколько глубоко им следует погружаться в анализ данных |
Существует четыре типа аналитики, и чем сложнее аналитика, тем эффективнее станет работа организации. Описательная аналитика берет за основу уже случившиеся факты. Так, например, руководитель медучреждения знает, сколько пациентов было госпитализировано в прошлом месяце; розничный торговец в курсе среднего еженедельного объема продаж; производитель на базе анализа ежемесячной выручки решает, на какой категории продуктов необходимо сфокусироваться.
Однако описательная аналитика лишь оперирует фактами, взятыми из одного или нескольких источников. Она может указать, что что-то идет не так, что-то работает неправильно, но, констатируя факты, не сообщает об их причинах, как это делает диагностическая аналитика .
Данный вид аналитики сравнивает накопленные данные с другими данными посредством более сложных алгоритмов, и в результате пользователь получает ответ на вопрос, почему произошло так, а не иначе. Благодаря диагностической аналитике стало возможным подробное изучение проблем, определение слабых мест и выявление закономерных цепочек событий, что помогает компаниям досконально разобраться в причинах конкретных проблем.
Предсказательная, или прогнозная аналитика сообщает о том, что может произойти или в каких объемах. Для выявления тенденций, групп сходных событий, исключений и для прогнозирования будущих тенденций она использует результаты описательной и диагностической аналитики.
«Несмотря на то что данный тип аналитики стал весьма ценным инструментом для прогнозирования и предоставляет многочисленные преимущества, важно понять, что прогнозирование — это в первую очередь оценка, точность которой в значительной степени зависит от качества данных и стабильности ситуации, — рассказывает Александр Тимчур, архитектор аналитических решений Hitachi Vantara. — А для этого требуются тщательная предварительная обработка данных, точный отбор признаков и непрерывная оптимизация прогнозной модели на "живых" данных, что обеспечивается за счет качественной экосистемы сопутствующих программных продуктов. Например, такие задачи решает интеграция предсказательных моделей (неважно, разработанных на компонентах Pentaho MI или open-source-инструментах Python/R) в промышленные процессы при помощи Pentaho Data Integration/Machine Orchestration. Компоненты Pentaho Business Analytics позволяют анализировать и визуализировать данные по нескольким измерениям, выявляя ценную информацию без помощи ИТ-специалистов компании».
Предсказательная аналитика помогает, например, телекоммуникационным компаниям идентифицировать тех абонентов, которые, скорее всего, сократят свои расходы или перейдут на обслуживание к другому оператору, и, соответственно, вовремя провести целевые маркетинговые акции во избежание потери клиентов. На основе анализа и прогнозирования объемов денежных потоков команда может взвесить риски инвестирования в расширение своей компании.
Предсказательная, или прогнозная аналитика активно используется на промышленных предприятиях, а также в транспортных компаниях. Например, программные системы Pentaho для интеграции и аналитики помогли компании Caterpillar Marine увязать между собой информацию, представленную в самых разрозненных форматах, для выявления скрытых взаимосвязей в работе разных механизмов судна и влияния внешней среды. Caterpillar Marine получила возможность учитывать те внешние факторы, которые почти не использовались в анализе ранее: показатели температуры топлива и двигателя, давления и частоты вращения, значения текущего местоположения судна, погоды, волнения и углов движения по отношению к волне.
Александр Тимчур: «Компоненты Pentaho Business Analytics позволяют анализировать и визуализировать данные по нескольким измерениям, выявляя ценную информацию без помощи ИТ-специалистов компании» |
«Находящаяся на корабле локальная система каждые 15 минут отправляет информацию в дата-центр на суше, — продолжает Александр Тимчур, — Здесь разнородные данные при помощи компонентов Pentaho Data Integration приводятся в унифицированный формат и загружаются в аналитическую систему, которая обеспечивает их масштабируемое согласование и передачу в инструменты предсказательной аналитики на базе открытого ПО, а также инфопанели и отчеты компании».
Цель рекомендательной аналитики — предложить, как именно следует поступать для устранения потенциальной проблемы или, например, как в полной мере использовать перспективную тенденцию. С помощью этого типа аналитики компании могут определить ассортимент дополнительных товаров для расширения списка покупок, изучив поведение клиентов и историю продаж, или изменить план обслуживания электропоездов для снижения частоты выхода их из строя.
Этот ультрасовременный тип аналитики требует не только накопленных архивных данных, но и получения адекватной внешней информации с помощью статистических алгоритмов, применяемых в процессе анализа. Кроме того, рекомендательная аналитика использует также машинное обучение, что делает ее достаточно сложной для реализации и управления. Поэтому, прежде чем принять решение о применении рекомендательной аналитики, компания должна оценить требуемые усилия, возможности и ожидаемую выгоду.
Какую аналитику выбирает бизнес?
Чтобы определить преобладающий тип аналитики данных, обратимся к недавним исследованиям по этой теме. В международном обзоре «Крупные решения» (Global Data and Analytics Survey: Big Decisions) приводятся результаты опроса более 2 тыс. руководителей, которые выбирали категорию, лучше всего описывающую процесс принятия решений в их компаниях. Кроме того, важно было выяснить, на какой тип аналитики больше всего полагаются респонденты. По результатам опроса в категории «редко принимаемые решения» доминировала описательная аналитика с показателем 58%, в категории «управление данными» список возглавила диагностическая аналитика (34%), прогнозный и рекомендательный типы расположились довольно близко: 29 и 28% соответственно.
Результаты этого исследования продемонстрировали, что на разных этапах развития компаний появляется потребность в аналитике разных типов. Фактически компании, которые стремятся к осознанному принятию решений, находят описательную аналитику недостаточной, прибегают к диагностической, а после и к прогнозной аналитике.
В ходе того же опроса обнаружилась еще одна интересная тенденция. Все руководители хотят, чтобы принятие решений осуществлялось быстрее, а сами решения были эффективнее. Это означает, что все большее количество организаций стремится к постепенному увеличению доли интеллектуальной аналитики. Еще одно исследование тенденций бизнес-аналитики за 2017 год, проведенное BARC, подтверждает эту гипотезу: 2800 руководителей отметили всевозрастающую важность интеллектуальных аналитических средств и интеллектуального анализа данных.
Подводя итоги, можно сказать, что компании выбирают, насколько глубоко им следует погружаться в анализ данных в зависимости от потребностей своего бизнеса. Описательная и диагностическая аналитика предлагают оперативный подход, прогнозная и рекомендательная аналитика позволяют пользователям принимать решения. Современные тенденции свидетельствуют о том, что ситуации, в которых компаниям необходим углубленный анализ данных, возникают все чаще. Вот почему организации по всему миру заинтересованы в качественных программных продуктах, позволяющих узнать бизнес со всех сторон и принять грамотные решения.