Мы являемся свидетелями бума технологий машинного обучения. Этот рынок развивается все быстрее, и игроки строят все более амбициозные планы. Достигнутые успехи впечатляют, однако они стали возможными благодаря работе специалистов высокого класса — экспертов по машинному обучению. Такие профессионалы многим просто не по карману. При этом их работа во многих случаях — в буквальном смысле «рукотворная»: ее большая часть делается вручную.
«Это апофеоз нерациональности: дорогостоящие специалисты тратят до 80% времени на предварительную подготовку данных — делают то, что вполне можно автоматизировать или хотя бы доверить менее квалифицированным сотрудникам», — отметила Екатерина Василенко, директор по продукту Neuton компании Bell Integrator. Естественно, постепенно стали появляться средства автоматизации такой работы. Этот класс решений известен как AutoML — речь идет об автоматизации всех рутинных процессов, связанных с машинным обучением. Например, такие решения дают возможность работать с сырыми, абсолютно неподготовленными данными — скажем, выгруженными из CRM.
Екатерина Василенко: «Это апофеоз нерациональности: дорогостоящие специалисты тратят до 80% времени на предварительную подготовку данных — делают то, что вполне можно автоматизировать или хотя бы доверить менее квалифицированным сотрудникам» |
Bell Integrator вывел на российский рынок облачную платформу Neuton AutoML, автоматизирующую рутинные процессы при работе с данными и позволяющую создавать прогнозные модели для решения множества задач силами бизнес-пользователей без специальной подготовки. По словам разработчиков, именно таким способом можно по-настоящему демократизировать искусственный интеллект — сделать его доступным для всех категорий пользователей.
Подобные платформы призваны стать своеобразным Excel в области машинного обучения, доступным массовому пользователю. Индустрия искусственного интеллекта будет идти по этому пути, и весь вопрос лишь в том, какое место на рынке займет каждая из платформ.
По мнению Василенко, гиганты (Amazon, Google или IBM), предлагающие свои разработки AutoML на внешнем рынке, вряд ли могут быть конкурентами локальным компаниям — в частности, из-за проблем с оперативной поддержкой. А новым пользователям всегда нужны советы по множеству мелких вопросов. Оперативная поддержка чрезвычайно важна, и этим сильны именно небольшие игроки.
Кроме того, для использования многих хороших решений, разработанных стартапами (H2O, DataRobot, BigML и др.), требуются серьезная подготовка и участие профессионалов. Небольшие компании, которые не могут себе позволить таких специалистов, лишаются возможности применять эти системы.
Платформа Neuton, работающая на облачной платформе Google, появилась в прошлом году, но только сейчас ее представили в России как готовое решение для широкого круга пользователей. Она представляет собой систему с поддержкой полного цикла создания моделей — от подготовки данных до развертывания моделей и интерпретации результатов. «Под капотом» у платформы нет чужих алгоритмов, она использует запатентованный фреймворк, разработанный в Bell Integrator. Как уверяют разработчики, создаваемые модели обладают высокой точностью, но при этом довольно компактны, что ускоряет процесс их обучения и снижает требования к вычислительным мощностям.
Опыт клиентов
«Я всегда был связан с бизнес-аналитикой, но не был погружен в дата-сайенс. Возможность освоить инструмент за несколько обучающих сессий — бесценна», — заявил Сергей Исаков, директор направления по клиентскому сервису компании «Филип Моррис Сэйлз энд Маркетинг», представляющей Philip Morris в России. По его словам, интуитивно понятный интерфейс крайне важен для освоения бизнес-пользователями.
«Филип Моррис» стремится быть компанией, предоставляющей передовой клиентский сервис. Для этого очень важно действовать на опережение — иметь возможность увидеть проблему до того, как клиент сообщит о ней. Именно с этим связан интерес компании к инструментам машинного обучения. Вместе с тем полное замещение ручного труда при построении моделей, по мнению Исакова, вряд ли возможно. Как всегда, важно найти правильный баланс между автоматизацией и человеческими усилиями.
Андрей Караулов: «Задачи машинного обучения требуют квалифицированных специалистов, и даже у них уходит довольно много времени на относительно простые задачи. Желание автоматизировать их работу вполне естественно» |
«Задачи машинного обучения требуют квалифицированных специалистов, и даже у них уходит довольно много времени на относительно простые задачи. Желание автоматизировать их работу вполне естественно», — отметил Андрей Караулов, руководитель департамента по работе с данными компании «ЛитРес», продающей аудио- и электронные книги. В «ЛитРес» всего несколько сотрудников, занимающихся аналитическими проектами, а работ очень много: разработка рекомендательной нейросети и предиктивной модели оттока, анализ текстов, автомодерация отзывов, классификация обращений в поддержку. Все они довольно трудоемкие. Работу с Neuton начали с построения предиктивной модели оттока: требовалось предсказать, приобретет ли клиент что-то в течение ближайшего месяца. В результате за полчаса удалось получить модель приличного качества, на основе которой можно строить маркетинговые активности.
«Я работала в банковской сфере и возглавляла дирекцию разработки продуктов. У наших специалистов всегда было много идей по повышению отклика клиентов и по новым продуктам, но из-за огромной очереди почти все они не доживали до стадии проверки на практике», — рассказала Юлия Аникина, директор по развитию бизнеса Neuton. Будь в распоряжении бизнес-специалистов инструмент, позволяющий ускорить процесс разработки моделей, все было бы иначе.
Даже если опытный дата-сайентист вручную несколько улучшит результат, упущенное время обойдется дороже. Важно понимать, что большую часть времени занимает не собственно творческая работа («магия»), а огромное количество ручного труда.