Человеческий мозг выполняет много сложной аналитической работы: мы учимся находить закономерности, объединять предметы и явления по общим признакам, распознавать и понимать языки, «живые» и программные. А еще собирать данные и делать прогнозы: например, будут ли расти и падать акции компании, в которые мы вложились.

Машины учатся делать те же задачи, но на другом уровне сложности, с помощью математической логики.

Что такое ML и где это применяют

На основе загруженных данных и с помощью алгоритмов компьютеры ведут аналитическую работу, приходя к результату быстрее, чем люди. Это и называется машинным обучением (или Machine Learning, или ML).

Где используется машинное обучение:

  • распознавание естественной речи (Siri, Алиса и другие виртуальные ассистенты);
  • распознавание рукописных букв и цифр;
  • определение языка в документе;
  • рекомендации на сайтах (похожие статьи, товары, музыка);
  • спам-фильтры;
  • поиск похожих документов;
  • определение подозрительных транзакций;
  • прогноз стоимости ценных бумаг;
  • анализ спроса, объема продаж;
  • детекторы аномального поведения (например, посетителей онлайн-казино);
  • риск-менеджмент;
  • самоуправляемые автомобили и умная техника: например, роботы-пылесосы;
  • компьютерные игры.

Список можно продлить еще на 20-30 пунктов, ведь компьютеры становятся сложнее, а методы машинного обучения совершенствуются. Поэтому от вопроса «для чего» перейдем к вопросу «как».

Корень – в данных

Датасеты, или структурированные базы данных – главное в процессе Machine Learning. Компьютеру требуется гораздо больше информации, чтобы научиться уверенно распознавать объекты. Например, программист из Нидерландов использовал искусственный интеллект, чтобы научить входную дверь впускать в дом кота. Чтобы программа отличала питомца от остальных, понадобилось сделать и загрузить около сотни его фотографий.

Если нужно усложнить задачу – например, научить машину отличать изображение любого кота от фотографий других животных – потребуются уже не сотни, а десятки тысячи изображений. Увидев 10 000 картинок, отмеченных как «кот», компьютер с большой долей вероятности распознает как «кота» 10 001-е неподписанное изображение.

Здорово, если у нас уже есть хорошая подборка картинок с котами. Но так бывает далеко не всегда: объемные и структурированные базы данных дорого стоят. Хорошая новость в том, что проводить машинное обучение можно и на базах, которые не структурированы, если использовать подходящий алгоритм.

AI Conference: Mashinnoe obuchenie: slozhnyiy protsess prostyimi slovami 1

Алгоритмы: выбираем путь

У одной и той же задачи почти всегда есть разные способы решения. Для ML способ, или алгоритм, выбирают в зависимости от типа задачи и вида базы данных, которая есть в распоряжении разработчиков.

Основные виды машинного обучения:

  • классическое;
  • с подкреплением;
  • ансамбли;
  • глубокое обучение.

Классическое обучение обычно делят на две категории – «с учителем» и «без учителя». В первом случае данные размечены, а во втором машина сама анализирует их и ищет закономерности. Результат «с учителем» быстрее и точнее, но найти или создать подходящую базу данных может быть непросто.

Обучение с подкреплением применяют там, где задача робота – выживание в некой среде (реальной или виртуальной). Так обучают персонажей (NPC) в компьютерных играх, роботов-пылесосов и самоуправляемые автомобили. Машина не оперирует данными – она обобщает ситуацию и пытается выйти из нее с реальной выгодой.

При методе ансамблей берется несколько машин с разными методами обучения, и их учат исправлять ошибки друг друга.

Глубокое обучение применяется для нейросетей. Это структуры из соединённых и взаимодействующих между собой простых процессоров, которые имитируют работу нейронов мозга. Сегодня это самая перспективная область ML: именно на нейросетях построены сервисы с распознаванием речи и изображений.

Машинное обучение в будущем

Развитие ML постоянно упирается в «потолок» доступного уровня технологии. Так, первая самоорганизующаяся сеть для распознавания образов была создана еще в 1975 году. Но пока не появились мощные процессоры, мы не могли загрузить в сеть фотографию и узнать, кто на ней изображен.

Следующий прорыв в машинном обучении связывают с квантовыми технологиями, а также дальнейшим развитием Data Mining (сбора и организации данных): как мы знаем, без данных машинное обучение невозможно. Совершенствование облачных технологий тоже даст новое пространство для развития ML.

Вероятно, к 2025 году нейросети станут сложнее и лягут в основу новых устройств и технологий. Голосовые ассистенты сделаются полезнее, умнее и доступнее; роботы обучатся новым профессиям. Мы увидим беспилотные автомобили и получим более удобные интернет-сервисы.