В рамках традиционного форума BIG DATA&AI 2022, проведенного издательством «Открытые системы», большое внимание участников вызвала сессия «Большая практика. Новый отсчет». Докладчики поделились опытом работы в новых условиях и рассказали об используемых инструментах. (Также о форуме см. статьи «BIG DATA&AI 2022: лучше вместе» и «BIG DATA&AI 2022: подходы и инструменты», «Компьютерный мир», 27 апреля 2022.)
«Обстоятельства сильно меняются, перед нами стоят серьезные вызовы. Data science в период кризисов перестает работать, включаются принципы ручного управления», — признал Тигран Саркисов, директор по работе с данными X5 Group, рассказавший об управлении данными в условиях меняющейся реальности. В X5 много интеллектуальных сервисов, охватывающих практически все направления: транспорт, логистику, маркетинг, чековую аналитику, цепочки поставок, ценообразование и т. п. Над ними работают более 50 продуктовых команд.
В начале года в X5 планировали совершенствовать дата-продукты, в том числе сокращать время их вывода на рынок, а также развивать культуру, основанную на данных, тиражировать self-service-аналитику, повышать стабильность платформы и снижать стоимость работы с данными. Однако проекты, связанные с клиентским путем, с конца февраля потеряли актуальность: гораздо важнее стала скорость принятия решений. «Если раньше приходилось тратить ресурсы на продвижение BI-инструментов, проводя демодни и обучая пользователей, то сейчас мы видим ажиотажный интерес к современной аналитике и резкий рост запросов на работу с ней — наблюдается кратный рост пользователей», — отметил Саркисов. Это направление очень эффективно, особенно сейчас. И вдвойне актуальными стали обеспечение непрерывности бизнеса и оптимизация затрат.
Александр Гусев, директор по развитию Webiomed и эксперт ЦНИИОИЗ Минздрава РФ по искусственному интеллекту, рассказал о том, что происходит с искусственным интеллектом в сфере здравоохранения. По его словам, несмотря на то что Указ Президента РФ № 490 «О развитии искусственного интеллекта в России», выпущенный еще в 2019 году, ставит целью ускоренное развитие искусственного интеллекта и определяет здравоохранение как одно из приоритетных направлений, реальность не соответствует ожиданиям. Во многом это связано с тем, что львиная доля финансирования проектов идет от государства, а частные инвесторы в эту область почти не заходят. К применению искусственного интеллекта в медицине отношение очень настороженное: высокие риски, непонятные бизнес-модели, неочевидный возврат инвестиций.
«Многие направления медицины полностью цифровизованы: данные есть, и их много. Мы сидим на огромных объемах данных. Однако вытащить их из организаций с целью проведения исследований или создания ML-продуктов практически невозможно», — констатировал Гусев.
Главная проблема для разработчиков интеллектуальных решений в медицине — именно раздобыть данные. И это при том, что государство с 2011 года инвестировало в ИТ в здравоохранении достаточно крупные средства — более 130 млрд руб., а по уровню внедрения информационных систем отечественная медицина сейчас уступает разве что американской. Еще одна огромная проблема заключается в том, что, несмотря на кажущийся огромным размер рынка, денег на нем практически нет.
Александр Гусев: «Многие направления медицины полностью цифровизованы: данные есть и их много. Мы сидим на огромных объемах данных. Однако вытащить их из организаций с целью проведения исследований или создания ML-продуктов практически невозможно» |
«Мы выживаем на грантах и не учимся зарабатывать на продуктах — это формирует нехорошую внутреннюю ситуацию: вряд ли в такой обстановке можно принести много пользы», — считает Гусев.
По наблюдению Ивана Кровякова, менеджера по развитию бизнеса Data Platform Yandex.Cloud, большинство компаний, начинающих путь в мир машинного обучения, концентрируются именно на технических вопросах: где взять «правильную» инфраструктуру, какие выбрать технологии, где взять данные и компетенции. Однако по мере их созревания становится понятно, что бизнес-ценность в значительной степени находится в процессной составляющей: как готовить данные, как разрабатывать модели, внедрять и переобучать их. Это имеет не меньшее значение, чем сами технологии. Поэтому важно сделать так, чтобы специалисты фокусировались не на вопросах «Что?» и «Где?», а на вопросе «Как?». Кровяков проиллюстрировал этот подход на примере проекта, реализованного в УБРиР.
Как известно, от 70% до 90% данных, с которыми приходится работать компаниям, являются неструктурированными. Это документация, внутренняя переписка, обращения от клиентов, взаимодействие с партнерами, отзывы в соцсетях, записи контакт-центров. Такие сведения необходимо анализировать. Дмитрий Гольцов, заместитель директора по коммерческой деятельности компании «Мегапьютер Интеллидженс», рассказал о возможностях платформы PolyAnalyst — системы «три в одном». Она включает инструменты, которые компании обычно приобретают по отдельности, а затем тратят значительные усилия на их интеграцию: систему ETL для извлечения, трансформации и загрузки данных, систему интеллектуального анализа данных и средства BI. По словам Гольцова, с использованием платформы точность извлечения фактической информации из неструктурированного текста в отдельных проектах превышает 90%.
«Газпром нефть» на протяжении последних трех лет активно вкладывается как в инструменты управления данными, так и в разработку решений на основе искусственного интеллекта. Эти направления действительно позволили повысить качество управления компанией, что уже доказано на практике.
«Самое главное, что на основе данных можно управлять компанией гораздо эффективнее, чем при традиционных подходах», — подчеркнул Анджей Аршавский, руководитель центра монетизации данных «Газпром нефти». По его словам, главной задачей было внедрение решений на основе ИИ по всей цепочке создания добавленной стоимости. Добыча и переработка нефти — очень технологичный процесс, и использование математических моделей при разведке и планировании разработки месторождений способно давать огромный эффект. В ходе своего выступления Аршавский уделил особое внимание решениям на основе искусственного интеллекта, использующимся в промышленном контуре.
Дмитрий Шведов: «Перед нами стоит цель — стать data-driven-компанией, то есть принимать решения не с помощью интуиции, а на основе данных» |
«Перед нами стоит цель — стать data-driven-компанией, то есть принимать решения не с помощью интуиции, а на основе данных», — заявил Дмитрий Шведов, CDO «Уралхима». В компании изначально понимали, что ресурсов ИТ-департамента всегда будет недостаточно, поэтому сразу начали двигаться в сторону использования инструментов самообслуживания: бизнес должен сам готовить себе данные и затем визуализировать их.
За 2021 год компания сделала большой скачок: ей многое дала платформа данных. Как отмечает Шведов, сейчас бизнес уже прекрасно понимает, что такое «корпоративное хранилище данных», и уверенно произносит аббревиатуру КХД.
За год в «Уралхиме» начали работать шесть продуктовых команд, две из них действуют полностью самостоятельно, разрабатывая для себя отчетность. Однако важно эти команды развивать, внедряя институты владения данными и сервисами. Для этого в нынешнем году планируется создать центр компетенций, основной задачей которого станет управление продуктовыми командами и выставление им целей по развитию сервисов.