Что такое машинное обучение?

Machine_learning_guide-min
БазовыйИскусственный интеллект
Machine_learning_guide-min
БазовыйИскусственный интеллект

Что такое машинное обучение?

Машинное обучение (МО) — это один из методов искусственного интеллекта, решающий задачу не прямым способом, а путем поиска закономерностей в данных после обучения алгоритма на множестве примеров.

Такие алгоритмы могут отвечать на вопрос, является фрукт на фотографии бананом или яблоком, определять переходящих дорогу людей перед беспилотным автомобилем, распознавать спам во входящих письмах электронной почты, генерировать субтитры для видео на YouTube.

Ключевое отличие от традиционного программирования заключается в том, что разработчик не пишет строгий код для инструктирования системы отличать банан от яблока. Вместо этого он создает модель, которая учится различать фрукты на большом количестве данных. В данном случае — на огромном количестве изображений бананов и яблок.

Чем машинное обучение отличается от искусственного интеллекта?

Машинное обучение является одним из методов искусственного интеллекта (ИИ).

Наряду с ним существуют и другие подходы, используемые для создания систем ИИ. Например, эволюционные алгоритмы, моделирующие процессы естественного отбора, а также экспертные системы, где компьютеры программируются в соответствии с правилами, позволяющими имитировать поведение человека-эксперта в определенной области. Например система автопилота самолета.

Какие существуют типы машинного обучения?

Выделяют несколько видов машинного обучения. На сегодняшний день самыми популярными являются:

  • обучение с учителем; 
  • обучение без учителя;
  • обучение с подкреплением.

Что такое обучение с учителем?

Это метод обучения машины находить закономерности на собственном примере. Как правило, инженер контролирует весь процесс обучения алгоритма.

Во время тренировки системе «скармливают» огромные массивы размеченных данных, например, изображения фруктов с аннотациями, указывающими на бананы и яблоки. При наличии достаточного количества примеров она научится распознавать кластеры пикселей и форм, связанных с каждым объектом, и в итоге сможет с высокой точностью распознавать их на фотографиях.

Однако для создания таких алгоритмов требуются огромные объемы помеченных данных. Некоторым системам необходимо использовать миллионы примеров, чтобы справиться с поставленной задачей.

Из-за этого некоторые датасеты могут достигать огромных размеров. Например, Google Open Images содержит около 9 млн изображений, YouTube-8M — 6 млн помеченных видео, а одна из первых баз такого типа — ImageNet — имеет более 14 млн разбитых по категориям изображений.

И это далеко не предел — размеры наборов обучающих данных продолжают увеличиваться. В 2019 году Facebook скомпилировал 3,5 млрд общедоступных фотографий в Instagram, используя прикрепленные к каждой из них хештеги в качестве меток. Использование одного миллиарда этих снимков для обучения системы распознавания объектов дало рекордный уровень точности — 85,4% по тесту ImageNet.

Что такое обучение без учителя?

Алгоритмы задач обучения без учителя пытаются выявлять сходства во входных данных и разделять их на категории. Как правило, тренировки таких моделей проходят без вмешательства со стороны человека.

Например, алгоритмы сервиса краткосрочного съема жилья Airbnb объединяет в кластеры дома, доступные для аренды по районам, а агрегатор новостей Google News каждый день создает подборки статей на похожие темы.

Алгоритмы обучения без учителя не предназначены для выделения определенных типов данных. Они просто ищут информацию, которую можно сгруппировать по сходству, или выделить аномалии.

Что такое обучение с подкреплением?

Данный метод подразумевает, что агенты ИИ научатся самостоятельно взаимодействовать со некой средой.

Самый простой способ понять суть обучения с подкреплением — это подумать о том, человек впервые играет в компьютерную игру, изучая правила в процессе. В итоге, глядя на взаимосвязь между нажатиями кнопок, результатом на экране и счетом, производительность геймера будет увеличиваться от уровня к уровню.

В 2013 году лаборатория DeepMind разработала алгоритм глубокого обучения с подкреплением, который превзошел людей в широком спектре классических видеоигр. Система получает пиксели из каждой игры, определяет различную информацию о ее состоянии (например, расстояние между объектами на экране) и рассматривает, как управление влияет на происходящее на экране и соотносится с набранным счетом.

В процессе многих циклов игры система строит модель того, какие действия позволят максимизировать счет и получить вознаграждение.

Другим ярким примером обучения с подкреплением является алгоритм AlphaGo, разработанной той же DeepMind. В 2016 году программа обыграла профессионального игрока в го Ли Седоля со счетом 4:1. При этом алгоритм не просчитывал все возможные варианты наперед. 

Ученые задолго до этого выяснили, что количество доступных комбинаций в этой игре больше, чем атомов в наблюдаемой Вселенной. Вместо этого AlphaGo оценивала ситуацию в контексте событий и подстраивалась под меняющиеся условия.

Как оценивают результаты машинного обучения?

После обучения модель оценивают с помощью данных, которые не использовались во время тренировки.

Для разработки алгоритма обычно используется около 60% набора данных. Еще 20% датасета отбирают для проверки прогнозов и корректировки дополнительных параметров, которые оптимизируют выходные данные модели. Эта точная настройка предназначена для повышения точности прогноза модели при представлении новых данных.

Остальные 20% набора используются для тестирования выходных данных обученной и настроенной модели, чтобы проверить точность прогнозов при представлении новой информации.

Что способствует популярности машинного обучения?

Несмотря на то, что машинное обучение не является новой техникой, в последние годы интерес к этой области резко возрос.

Этому способствовала серия прорывных инноваций, благодаря которым МО установило новые рекорды точности в таких областях, как обработка естественной речи и компьютерное зрение. Успех стал возможным благодаря двум факторам: огромное количество данных для обучения и доступность огромных мощностей для параллельных вычислений с помощью современных графических процессоров.

Кроме этого, появились целые облачные кластеры для машинного обучения. Сегодня любой пользователь может использовать услуги компаний вроде Amazon, Google и Microsoft для разработки собственных моделей.

По мере роста популярности МО технологические гиганты создают специализированное оборудование, предназначенное для запуска и обучения моделей машинного обучения. Например, Google занимается разработкой специализированных тензорных процессоров (TPU), которые ускоряют процесс обучения алгоритмов. 

В 2021 году компания представила четвертую версию чипа для совершенствования облачной инфраструктуры Google. По словам разработчиков, кластер из 4096 TPUv4 сможет обеспечить производительность более одного экзафлопса.

Задачи МО все чаще выполняются на телефонах и компьютерах потребительского уровня, а не только в облачных центрах обработки данных. В 2017 году компания Apple представила iPhone X с процессором A11 Bionic, оборудованный специальным чипом для вычислений задач машинного обучения. С каждым годом компания совершенствует процессор, обеспечивая возможность развертывания требовательных алгоритмов на мобильных устройствах.Google также всячески старается поддерживать МО-гонку на мобильных устройствах. Летом 2021 года компания представила платформу Android ML и добавила TensorFlow Lite в сервисы Play. По словам разработчиков, благодаря этому обработка алгоритмов на устройстве обеспечит меньшую задержку, более эффективное использование батареи и функции, не требующие подключения к сети.

Для чего используют машинное обучение?

На сегодняшний день системы машинного обучения используются повсюду и являются краеугольным камнем современного интернета.

Каждый поисковой запрос в Google запускает сразу несколько моделей МО: распознавание текста, персонализация выдачи результатов и так далее. Точно так же работает система распознавания спама в Gmail, определяя мошеннические сообщения.

Рекомендательные системы в онлайн-магазинах могут предсказать, какой продукт вы захотите купить в следующий раз или какой фильм вам понравится на Netflix.

Одним из наиболее ярких примеров использования машинного обучения в повседневной жизни являются виртуальные помощники вроде Siri от Apple, Alexa от Amazon или Google Assistant. Каждый из них в значительной степени полагается на МО для распознавания голоса и способности понимать естественный язык, а также нуждается в огромной информационной базе для ответов на запросы.

Системы находят применение во множестве отраслей, включая:

  • компьютерное зрение для беспилотных автомобилей, дронов и робокурьеров;
  • обработка естественной речи для чат-ботов и виртуальных ассистентов;
  • распознавание лиц; 
  • обнаружение опухолей на рентгеновских снимках; 
  • возможность профилактического обслуживания инфраструктуры путем анализа данных датчиков Интернета вещей.

И это далеко не исчерпывающий список.

Объективны ли модели машинного обучения?

Качество и объем данных, используемых для обучения систем, влияют на задачи, для которых они подходят. В последнее время в научной среде растет обеспокоенность по поводу того, как системы машинного обучения кодифицируют человеческие предубеждения и социальное неравенство, отраженные в обучающих данных.

2016 году сотрудник Национального научного фонда с факультета лингвистики Вашингтонского университета Рэйчел Татман обнаружила, что система распознавания речи Google лучше работает с мужскими голосами, чем с женскими во время автоматического добавления субтитров к видео на YouTube. Она связала результат исследования с «несбалансированным тренировочным сетам», в которых преобладали говорящие мужчины.

Системы распознавания лиц сталкиваются с трудностями идентификации женщин и людей с темными оттенками кожи. Вопросы об этичности использования таких потенциально предвзятых систем для работы полиции привели к тому, что крупные технологические компании временно приостановили их продажу правоохранительным органам.

В июне 2020 года Amazon запретила правоохранительным органам США использовать программное обеспечение для распознавания лиц в разгар протестов против жестокости полиции. Спустя год компания продлила мораторий на неопределенный срок.

В 2018 году Amazon также отказалась от инструмента найма на основе машинного обучения, который определял кандидатов-мужчин в качестве предпочтительных.

По мере того, как системы машинного обучения переходят в новые области, такие как помощь в диагностике заболеваний, возможность смещения систем в сторону предоставления более качественных услуг или более справедливого лечения определенных групп людей становится все более серьезной проблемой.

На сегодняшний день продолжаются исследования способов снижения предвзятости в самообучающихся системах.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK