Машинное обучение используют компании, которые хотят предложить клиентам полезный продукт или повысить эффективность своего бизнеса. К такому наблюдению пришёл исследователь в лаборатории искусственного интеллекта в Сбербанке Дмитрий Бабаев. Эта же фраза объясняет, почему компании интересуются технологиями AI и Data Science. Подробнее – в нашем интервью.

Дмитрий Бабаев руководил отделом Data Science в МТС, а также разработал алгоритм автодополнения запросов в поисковике «Яндекс». Сейчас занимается исследованиями в области применения глубинного обучения для банковской сферы.

Интервьюер: AI Conference (AI)
Респондент: Дмитрий Бабаев (Д.Б.)

AI: Дмитрий, как происходит обучение нейронных сетей?

Д.Б.: С помощью градиентного спуска. Он применяется для многих моделей машинного обучения, не только нейросетей. Даже для популярных методов линейной и логистической регрессии. В нейросетях используется его разновидность – стохастический градиентный спуск, позволяющий не загружать в память сразу все данные, которые необходимы для обучения. В распределённой версии алгоритма можно использовать много серверов, что позволяет заметно ускорить ресурсоёмкий процесс обучения нейросети.


AI: С какими проблемами приходится сталкиваться при машинном обучении?

Д.Б.: Их много. Есть проблемы, зависящие от выбора метода, а есть общие для всего машинного обучения. Например, существует проблема переобучения, которая возникает при использовании любого алгоритма машинного обучения (МО). Упрощенно её можно описать так: алгоритм запоминает тренировочную выборку вместо того, чтобы строить обобщения по ней. Это типичная проблема для всего МО.

Конкретно у нейросетей есть две другие:

1-я – объём данных, необходимый для их обучения. Нейросеть – это модель, у которой очень много параметров, поэтому ей необходимо показать огромное количество примеров для обучения. В большинстве случаев каждый из них должен быть подготовлен человеком. Таким образом, это проблема трудоёмкости создания выборки для обучения.

2-я – количество гиперпараметров. У каждой нейросети своя архитектура, слои, их типы и организация. Каждый раз подобрать нужную – это особое искусство, и каждый раз – это интуиция исследователя, а также метод проб и ошибок.


AI: Технологию машинного обучения можно встретить, прежде всего, в банковской сфере и телекоммуникациях. В каких ещё областях она может пригодиться?

Д.Б.: Практически во всех, где есть данные, из которых можно извлечь пользу. В любой компании хотят предложить клиентам что-то полезное и не хотят предлагать бесполезное. И в этом может помочь технология машинного обучения.

Интернет-компании давно и активно используют технологии машинного обучения, например, в системах персональной рекомендации контента.

В традиционных отраслях есть успешные истории применения технологии МО. Так, совместно с Yandex Data Factory машинное обучение внедрили в сталелитейной индустрии для правильного подбора состава сплавов и добились приличной экономии.


AI: У каких российских компаний есть своя лаборатория ИИ и Big Data?

Д.Б.: У немногих компаний в России есть подобная лаборатория, поскольку обычно это академическая история. В «Яндексе» совершенно точно работает исследовательское подразделение.

Есть международные компании, открывающие свои исследовательские центры в России. Samsung, например. Не знаю, насколько это подойдёт к российским примерам… Возможно, Alibaba откроет такой центр в России.


AI: Всё потому, что они нуждаются в наших специалистах?

Д. Б.: Да, именно. В России всегда была очень хорошая математическая школа. Здесь много хороших специалистов по Data Science и AI, поэтому компании открывают исследовательские центры в РФ.


AI: Ваш прогноз: какой процент операций будет выполнять искусственный интеллект через год-пять?

Д.Б.: Сложно заглядывать в будущее, потому что на повсеместное использование ИИ влияют два аспекта: технологический – на что способна инновация, и социальный – к чему готово общество. Хороший пример – технология беспилотных авто: есть мнение, что в США уже сегодня можно заменить автоматикой всех дальнобойщиков на трассах между городами. В сумме это около семи миллионов рабочих мест, исчезновение которых приведёт к сложно прогнозируемым социальным последствиям в стране с населением порядка 300 млн человек.


AI: Кому пора задуматься об освоении новой профессии, помимо дальнобойщиков? Иными словами, какие должности искусственный интеллект заменит прежде всего?

Д.Б.: Опять сложный вопрос. Думаю, что сейчас технологии МО не позволяют полностью исключить человека – они хорошо работают в связке с людьми. Например, если раньше в рекламном агентстве было условно 100 менеджеров рекламных кампаний, то после внедрения алгоритма автоматического подбора целевой аудитории их будет 10, зато очень хороших. Они будут обрабатывать пограничные случаи, где ИИ не справляется.

Он в первую очередь появится там, где есть много рутинных операций, поддающихся алгоритмическому описанию; где человек работает по шаблону, без творчества. Если же в работе есть социальная составляющая – замена человека ИИ произойдёт нескоро, несмотря на чат-ботов и диалоговые системы. Точно не в ближайшие 5 лет, но это на мой взгляд.

Если говорить о роботах (классических), то, как ни странно, нескоро появится робот-уборщик. Это сложная технология, от робота требуются ориентация в пространстве, навигация и точные действия. Вот что я мечтаю дома автоматизировать (улыбается – прим. авт.). Или робот-повар. Приходишь домой с работы, а он сам готовит и накрывает на стол. Было бы неплохо.


AI: А как же робот-пылесос?

Д.Б.: Это очень простая штука, дома у меня есть такая. Она умеет только ездить по полу, дома становится меньше пыли – и всё. А протереть пыль на тех же полках – уже не умеет.


А вы согласны с прогнозами специалиста? Приходите на AI Conference, чтобы побеседовать с Дмитрием и другими спикерами.

Купить билет ►►►