Правильно поставленная задача – 30% успеха при оптимизации процессов, говорит руководитель направления «Большие данные и машинное обучение» в «Инфосистемы Джет» Евгений Колесников. Мы поговорили с ним и выяснили, как интернет-магазину подготовиться к чёрной пятнице и кто лучше всех понимает, как монетизировать большие данные.

Интервьюер: AI Conference (AI)
Респондент: Евгений Колесников (Е. К.)

AI: Какие бизнес-задачи помогают решить большие данные и машинное обучение?

Е. К.: В целом машинное обучение (ML) и аналитика больших данных (Big Data) помогают решать любые оптимизационные задачи, где есть эти данные. К примеру, на производстве при помощи этих инструментов можно улучшить показатели, используя данные производительности прокатного стана, такие как его скорость, выработка и т. п. В банках аналитика больших данных и машинное обучение позволят значительно улучшить пользовательский опыт, бизнес-процессы, а также выявление мошенничества и безопасность в целом. В ритейле Big Data и ML выводят на новый уровень customer relationship – это маркетинговые акции, оптимизация клиентского пути, улучшение пользовательского опыта при работе сайтом и другими каналами взаимодействия с компанией.

Во всех этих задачах ML помогает оптимизировать (то есть снижать издержки или увеличивать прибыль) на 5-10%, иногда на 30% – всё зависит от задачи.


AI: С какими проблемами сталкиваются специалисты при машинном обучении?

Е. К.: Ключевые сложности, с которыми сталкиваются при ML – это недостаточность данных и отсутствие чёткой постановки задачи. Сегодня рынок представляет себе искусственный интеллект чем-то вроде «Красной королевы» из фильма «Обитель зла», где машина говорит женским голосом и стреляет лазерами. Но это не так. ML всегда решает четкую бизнес-задачу. Чтобы процесс пошел, необходимы очень ясно сформулированная цель и данные, которые помогут её решить. И именно здесь чаще всего кроется проблема: либо не хватает данных, либо бизнес-составляющей, либо внутреннего понимания.

Самая первая и большая сложность, которая исходит от заказчика: нам нужно найти человека, который вместе с нами мог бы поставить бизнес-задачу. ML – это определённый стиль мышления, под который нужно подогнать вопрос, чем мы с коллегами и занимаемся. Первые 30% успеха проекта – выбрать правильную задачу и правильную постановку для её решения.


AI: А как насчёт проблем технологического характера?

Е. К.: На сегодня технологический инструментарий ML для решения тех или иных бизнес-задач достаточно полон, проблемы скорее с пониманием того, как с ним жить и как работать.


AI: Когда и к кому должно прийти это понимание?

Е. К.: Это сходящийся процесс: с одной стороны, его «толкают» интеграторы (мы и наши коллеги), с другой – существует внутренняя потребность, которая рано или поздно заставит компании перестроить внутреннюю логику понимания. Знаете, это как автоматизация производства во времена первой технологической революции: бизнес-процессы менялись изнутри. Нужно было по-другому мыслить, чтобы автоматизировать их с помощью IT. По тому же пути шло внедрение CRM, ERP.

Почти аналогично сегодня двигается ML. Никто не сомневается, что технология полезна и поможет решать множество вопросов. Главным на сегодня остаётся внутреннее понимание и перестройка заказчика под новые технологии. Мы видим, что крупные игроки перестраиваются, но им это тяжело даётся – они первопроходцы, у них очень большие объёмы данных. Например, «Мегафон» выделил для этого целую отдельную компанию – oneFactor*. А Сбербанк, например, формирует команду внутри собственной структуры и развивается в этом направлении.

Есть новые компании, которые рождаются вокруг технологий. Но они изначально технологичны – им не нужно перестраивать что-либо изнутри.

Позитивным фактором является и то, что ML – достаточно «модный», обсуждаемый инструмент, и открывая у себя подразделения ML или Big Data, компания стремится заявить об этом. Это играет не последнюю роль в дальнейшей популяризации инструментов.


AI: Какой проект в «Инфосистемы Джет» для вас был самым интересным? Почему?

Е. К.: Мы участвовали в хакатоне М.Видео, заняли призовое место и, соответственно, продолжили развивать с ними один проект. Смысл его в том, чтобы трансформировать отзывы на товары в понятные характеристики.

Возьмём, к примеру, стиральную машину. Про неё написано множество отзывов вроде «отлично работает», но есть и смысловые – «помещается под раковину», «узкий барабан» и т. д. Люди описывают те характеристики, которые компания изначально не внесла в карточку товара, но они имеют большое значение для потребителя. Задача – автоматизированными инструментами выбрать из текста эти характеристики и вывести в карточку товаров.


AI: А какой был самым сложным?

Е. К.: Заказ от одного из топ-10 банков. Нужно было выявить внутренний фрод: опознать мошенничество среди сотрудников-операционистов по их поведению в различных системах. Заказчик предоставил нам данные о том, как сотрудники ведут себя в тех или иных системах. По ним нужно было спрогнозировать склонность работника к мошенничеству.

Сложности были в очень большом объёме данных и их источниках. Мы перестраивали внутреннее понимание того, как выявлять мошенников. Взаимодействие с заказчиком в рамках ML и качество моделей проверок результатов – всё это было достаточно сложно. Работа над проектом была долгой и кропотливой.


AI: Над чем работаете сейчас?

Е. К.: В основном работаем с производством. Большинство задач – самых сложных и интересных – мы сегодня решаем для сталеплавильных компаний. У них очень много данных и при этом есть понимание, как извлечь пользу, как монетизировать ML и его методы. В сфере производства увеличение какой-то метрики на 1-2% приносит сотни миллионов прибыли в год.

Много проектов по ритейлу. Это задачи по маркетинговым кампаниям, оптимизации внутренних процессов, связанных с товарооборотом и товарными матрицами.

В банках – это различные задачи по повышению capacity, о чём мы будем рассказывать, по безопасности. Опять же маркетинг: необходимо понимать, что и как предложить клиентам.

Сегодня мы видим большой спрос, сейчас на рынке он превышает предложение.


AI: Евгений, на AI Conference Вы планируете рассказать о разработке, предсказывающей изменение нагрузки на IT-ресурсы. Кому будет интересна эта тема?

Е. К.: Она интересна всем, кто использует серверы в своей повседневной работе, то есть, пожалуй, любой компании. Здесь ключевой вопрос – а что будет, если завтра мы вырастем на 30%? Он тянет за собой другие: какие системы попадут под нагрузку, какие из них необходимо расширять?

Компания не может, как мы с вами – обычные пользователи – прийти на Савеловский рынок и купить дополнительный системник. Машины собираются под заказчика, потом едут к нему в течение примерно трёх месяцев. План нужно проработать за полгода до фактической надобности. Поэтому сегодня наш кейс очень важен.

У нас есть методы, позволяющие предсказать поведение как конкретной машины, так и всей системы в зависимости от бизнес-параметров. К примеру, у интернет-магазина чёрная пятница – количество клиентов увеличится втрое. Какие системы будут испытывать максимальную нагрузку? На какие параметры обратить внимание – CPU, оперативная память или ещё что-то? Что нужно поддержать прямо сейчас? Если это виртуальная ферма, то повысить их capacity, чтобы пережить пик.

Мы строим два вектора, где показываем, как будет расти загрузка, и даём ответ, что будет с информационной системой в зависимости от скачков бизнес-показателей: увеличения количества касс, роста магазинов, звонков в support. Это всё сильно влияет на IT-системы, а от их стабильности зависит работа всей компании.


Приходите на AI Conference, чтобы обезопасить компанию от «перегруза» с помощью ML. Купить билет ►►►

* Один из основателей компании – экс-менеджер «Мегафона», также в компанию вошли бывшие сотрудники RnD-подразделения оператора. Сама компания является независимым технологическим партнёром «Мегафона».