Как системы компьютерного зрения смогут облегчить работу мерчандайзеров? Какое решение в сфере машинного обучения станет альтернативой Amazon или Google? Об этом мы побеседовали с Сергеем Николенко – спикером AI Conference, директором по науке в AI-компании Neuromation.

Neuromation  стартап, который разработал блокчейн-платформу синтетических данных нейросети, а также систему для распознавания товаров по внешнему виду. В начале 2018 года Neuromation удалось собрать $50 млн в ходе ICO.

Интервьюер: AI Conference (AI)
Респондент: Сергей Николенко (С. Н.)

AI: Расскажите подробнее о платформе Neuromation: как и где ее можно использовать?

С. Н.: Это основной продукт нашей компании, мы разрабатываем ее для помощи специалистам по искусственному интеллекту. Хочется верить, что Neuromation будет лучшим решением для экспертов по Deep Learning и другим областям машинного обучения, чем существующие предложения от той же Amazon или Google. На платформе будет возможно и арендовать вычислительные мощности, и получить открытые или купить частные наборы данных, и породить новые синтетические данные (о них мы ещё поговорим), и, конечно же, вести разработку и обучение глубоких нейронных сетей и других моделей машинного обучения.

Более того, мы надеемся, что когда платформа «взлетит», она станет не просто набором инструментов, а неким хабом для сообщества специалистов по искусственному интеллекту. Другими словами, там будут люди, которые смогут не только пользоваться платформой, но и, например, принимать внешние заказы от компаний, которым сейчас трудно решить свои проблемы в сфере ИИ. Сейчас найти и нанять экспертов высокого уровня очень непросто.


AI: Стартап Neuromation всего за восемь часов собрал на ICO $50 млн. Чем вы можете объяснить такой успех?

С. Н.: Главное объяснение  это, конечно, наши гениальные продажники, в основном наш Chief Revenue Officer Эван Кац; успех токенсейла  во многом его заслуга. Но правда и в том, что с токенсейлом нам очень повезло. Можно сказать, что мы запрыгнули в последний вагон уже уходящего поезда. Вскоре после того, как мы сделали свой токенсейл, все криптовалюты и токены сильно обвалились, интерес к ним несколько упал, и потом уже не было слышно об историях успеха такого масштаба. Я не буду утверждать, что это ровно последнее успешное ICO, но одно из последних точно. Уже через пару месяцев после того, как мы завершили свой токенсейл, рынок рухнул.


AI: Одна из ваших разработок — система распознавания товара на полке. Как эта система помогает торговым сетям?

С. Н.: Это был наш первый проект, с него начиналась идея компании Neuromation. Эта идея сейчас стала центральной для внутренних исследований синтетических данных, с помощью которых происходит обучение нейронных сетей.

Смысл проекта довольно простой. Существует миллионная армия мерчандайзеров, которые ходят из магазина в магазин и проверяют, все ли в порядке на полках. Например, занимает ли Coca-Cola 30% места, за которые она заплатила, и все ли бутылки стоят лицом к покупателю. Но человек, конечно, не должен заниматься такими вещами. Этот процесс можно автоматизировать с помощью современного компьютерного зрения.

Когда мы начали проект, поначалу казалось, что задача довольно стандартная: распознавание объектов на изображениях. Но быстро выяснилось, что данных для обучения нейронных сетей не просто мало, а принципиально невозможно получить в достаточном количестве: каталог товаров огромен, в списке розницы  170 000 наименований, и собрать набор размеченных вручную снимков, который покрывает 170 000 разных классов в разных комбинациях, нереально.

Отсюда родилась идея синтетических данных. Мы начали делать 3D-модели товаров: скажем, 3D-модель бутылки, на которую наклеиваются виртуальные этикетки. Таким образом, из одной модели получается десяток или больше товаров, которые мы располагаем на виртуальных полках. Так формируется обучающая выборка «мультяшного» супермаркета. Ноу-хау в том, что нам действительно удается обучать модели компьютерного зрения на таких вот «мультиках» и переносить это потом в реальность.


AI: Какими исследованиями в области молекулярной биологии и медицины занимается Neuromation? С какими препятствиями сталкиваетесь на пути внедрения ИИ в здравоохранение?

С. Н.: У нас есть два основных направления. Одно из них  тоже компьютерное зрение, но для здравоохранения; это обработка разного рода медицинских снимков. У нас есть специалисты, которые считаются лучшими именно в этой области, мы постоянно участвуем в соревнованиях, пишем статьи об этом.

Другое направление  это наше сотрудничество с Insilico Medicine. Insilico  компания, которая пытается найти новые лекарства при помощи современных, а часто и вновь разработанных моделей машинного обучения. Мы уже заканчиваем один важный совместный проект, и надеюсь, что скоро сможем о нем рассказать.

Внедрение искусственного интеллекта в сферу здравоохранения  сложная задача. Многие разработчики из разных сфер жалуются, что циклы внедрения в медицине огромные. На самом деле это не специфично для того же искусственного интеллекта: чтобы вводить в использование медикаменты, в любом случае нужно пройти очень долгий цикл.

Если ваша нейронная сеть придумала лекарство, его нельзя просто взять и начать продавать в таблетках. Все равно сначала нужны будут лабораторные, а потом клинические исследования. К счастью, нам не нужно заниматься этим лично, для этого есть партнеры в соответствующих индустриях.

Но процессы в медицине действительно происходят медленно. Например, компания Insilico уже давно занимается drug discovery, то есть поиском новых соединений, которые могли бы стать эффективными лекарствами. И за годы работы у них пока нет ни одного препарата, который бы полностью прошел весь цикл. Именно потому, что процесс очень долгий.


AI: Один из проектов Neuromation — обработка спутниковых снимков. Что это за проект, каковы его цели?

С. Н.: Это исследовательский проект. Мы несколько неожиданно, но очень успешно поучаствовали в соревновании DeepGlobe, которое проводилось в рамках крупнейшей конференции по компьютерному зрению в 2018 году. Там было несколько заданий, связанных с обработкой спутниковых снимков: с сегментацией участков земли на изображениях, а также с сегментацией дорог и домов на спутниковых снимках. Мы в этих соревнованиях заняли довольно высокие места, написали три статьи, которые опубликовали в сборнике соответствующего семинара. Это был научный успех нашей компании.


AI: Вы долгое время сотрудничали с Samsung. Расскажите: чем занимались, в каких разработках участвовали?

С. Н.: Это уже связано не столько с Neuromation, сколько со мной лично. С компанией Samsung я сотрудничаю давно, мы делали совместные проекты на базе Санкт-Петербургского отделения Математического института имени В. А. Стеклова (ПОМИ РАН), где я работаю уже 15 лет. Моя основная профессия  ученый-исследователь (вот, например, список моих публикаций); кроме того, я постоянно преподаю.

Samsung несколько лет подряд выделяла гранты на исследования по искусственному интеллекту в ПОМИ, а начиная с этого года, наши отношения вышли на новый уровень. Теперь Samsung поддерживает целую лабораторию в институте, я ею руковожу.

Также в Москве недавно открылся Samsung AI-центр. Это совершенно новое подразделение, которое сконцентрировано на искусственном интеллекте. Я удалённо и на условиях частичной занятости руковожу одной из лабораторий в этом центре. Там мы занимаемся анализом мультимодальных данных, то есть машинным обучением в ситуациях, когда одновременно доступны данные разной природы: картинки, тексты, звук.


AI: О чем расскажете в своем докладе на AI Conference?

С.Н.: Я расскажу о синтетических данных  о той самой основной идее, которую мы в компании Neuromation продвигаем для компьютерного зрения. Доклад планируется начального уровня, никакой особенно сложной математики в нем не будет.

Также я приведу примеры, расскажу, как идея постепенно набирает популярность. Ведь решение, как ни странно, очень новое, хотя и лежало всегда на поверхности. И, возможно, я расскажу о том, как люди сейчас пытаются порождать и улучшать синтетические данные с помощью других моделей машинного обучения.


Сергей Николенко выступит на международной AI Conference, которая состоится 22 ноября в Москве.

Зарегистрироваться