Эта страница переведена с помощью Cloud Translation API.

Что такое машинное обучение?

Машинное обучение (МО) лежит в основе многих важнейших технологий, которые мы используем, от приложений для перевода до беспилотных автомобилей. Этот курс объясняет основные концепции, лежащие в основе МО.

Машинное обучение предлагает новый способ решения проблем, ответа на сложные вопросы и создания нового контента. Машинное обучение может прогнозировать погоду, оценивать время в пути, рекомендовать песни, автоматически дополнять предложения, резюмировать статьи и генерировать невиданные ранее изображения.

В общих чертах, машинное обучение — это процесс обучения программного обеспечения, называемого моделью , для выполнения полезных прогнозов или генерации контента (например, текста, изображений, аудио или видео) на основе данных.

Например, предположим, мы хотим создать приложение для прогнозирования осадков. Мы можем использовать либо традиционный подход, либо подход на основе машинного обучения. При традиционном подходе мы бы создали физически обоснованное представление атмосферы и поверхности Земли, вычисляя огромное количество уравнений гидродинамики. Это невероятно сложно.

Используя подход машинного обучения, мы бы предоставляли модели машинного обучения огромные объемы метеорологических данных до тех пор, пока модель не научилась бы математической зависимости между погодными условиями, которые приводят к различному количеству осадков. Затем мы бы предоставляли модели текущие метеорологические данные, и она бы прогнозировала количество осадков.

Проверьте свои знания

Что такое «модель» в машинном обучении?

Модель — это математическая зависимость, выведенная из данных, которую система машинного обучения использует для построения прогнозов.

Модель — это элемент компьютерного оборудования.

Модель — это уменьшенное изображение изучаемого объекта.

Типы систем машинного обучения

Системы машинного обучения подразделяются на одну или несколько из следующих категорий в зависимости от того, как они учатся делать прогнозы или генерировать контент:

Обучение под наблюдением
Обучение без надзора
Обучение с подкреплением
Генеративный ИИ

Обучение под наблюдением

Модели контролируемого обучения могут делать прогнозы после анализа большого количества данных с правильными ответами и выявления связей между элементами данных, которые приводят к этим правильным ответам. Это похоже на то, как студент изучает новый материал, используя старые экзаменационные задания, содержащие как вопросы, так и ответы. После того, как студент обучится на достаточном количестве старых экзаменационных заданий, он будет хорошо подготовлен к сдаче нового экзамена. Эти системы машинного обучения являются «контролируемыми» в том смысле, что человек предоставляет системе машинного обучения данные с известными правильными результатами.

Два наиболее распространенных варианта применения обучения с учителем — это регрессия и классификация.

Регрессия

Регрессионная модель предсказывает числовое значение. Например, метеорологическая модель, которая предсказывает количество осадков в дюймах или миллиметрах, является регрессионной моделью.

В таблице ниже приведены дополнительные примеры регрессионных моделей:

Сценарий	Возможные входные данные	Численное прогнозирование
Будущая цена дома	Площадь, почтовый индекс, количество спален и ванных комнат, размер участка, процентная ставка по ипотеке, ставка налога на недвижимость, стоимость строительства и количество домов, выставленных на продажу в этом районе.	Цена дома.
Будущее время поездки	Исторические данные о дорожной ситуации (полученные со смартфонов, датчиков движения, приложений для заказа такси и других навигационных систем), расстояние до пункта назначения и погодные условия.	Время в минутах и секундах, необходимое для прибытия в пункт назначения.

Классификация

Классификационные модели предсказывают вероятность принадлежности объекта к определенной категории. В отличие от регрессионных моделей, результатом работы которых является число, классификационные модели выдают значение, указывающее, принадлежит ли объект к определенной категории или нет. Например, классификационные модели используются для прогнозирования того, является ли электронное письмо спамом или содержит ли фотография кошку.

Модели классификации делятся на две группы: бинарная классификация и многоклассовая классификация. Модели бинарной классификации выдают значение из класса, содержащего только два значения, например, модель, которая выдает либо rain , либо no rain . Модели многоклассовой классификации выдают значение из класса, содержащего более двух значений, например, модель, которая может выдавать либо rain , hail , snow » или sleet .

Проверьте свои знания

Если бы вы хотели использовать модель машинного обучения для прогнозирования энергопотребления коммерческих зданий, какой тип модели вы бы использовали?

Регрессия

Потребление энергии измеряется в киловатт-часах (кВт·ч), что является числом, поэтому вам следует использовать регрессионную модель.

Классификация

Классификационные модели предсказывают, относится ли объект к той или иной категории, тогда как регрессионные модели предсказывают числовое значение. Поскольку потребление энергии измеряется в киловатт-часах (кВт·ч), что является числом, вам следует использовать регрессионную модель.

Обучение без надзора

Целью модели обучения без учителя является выявление значимых закономерностей в наборе данных. Например, многие модели обучения без учителя используют метод кластеризации для организации похожих данных в группы («кластеры»).

Изображение, на котором цветные точки сгруппированы в скопления.

Рисунок 1. Модель машинного обучения, кластеризующая похожие точки данных.

Изображение, на котором цветные точки сгруппированы в скопления, заключены в определенную фигуру и граничат друг с другом.

Рисунок 2. Группы кластеров с естественными границами.

Кластеризация отличается от классификации тем, что категории определяются не вами. Например, модель без учителя может кластеризовать набор данных о погоде на основе температуры, выявляя сегментацию, определяющую времена года. Затем вы можете попытаться назвать эти кластеры, основываясь на своем понимании набора данных.

Изображение, на котором цветные точки сгруппированы по категориям: снег, дождь, град и отсутствие дождя.

Рисунок 3. Модель машинного обучения, объединяющая схожие погодные условия в кластеры.

Изображение, на котором цветные точки, сгруппированные в группы и обозначенные как снег, дождь, град и отсутствие дождя, заключены в фигуру и граничат друг с другом.

Рисунок 4. Группы погодных явлений, обозначенные как снег, мокрый снег, дождь и отсутствие дождя.

Проверьте свои знания

В чём отличие контролируемого подхода от неконтролируемого?

В подходе с обучением под наблюдением используются данные, содержащие правильный ответ.

В контролируемом подходе модели предоставляются данные, содержащие правильный ответ. Задача модели — найти в данных связи, которые приводят к правильному ответу. В неконтролируемом подходе модели предоставляются данные, не содержащие правильного ответа. Ее задача — найти группировки в данных.

В подходе с обучением под наблюдением обычно используется кластеризация.

В одном из подходов, не предполагающем обучение под наблюдением учителя, используется кластеризация.

Метод обучения без учителя знает, как маркировать кластеры данных.

При неконтролируемом подходе неизвестен смысл кластеров данных. Определение кластеров зависит от вашего понимания данных.

Обучение с подкреплением

Модели обучения с подкреплением делают прогнозы, получая вознаграждения или штрафы в зависимости от действий, совершаемых в окружающей среде. Система обучения с подкреплением генерирует стратегию , определяющую наилучший способ получения максимального вознаграждения.

Обучение с подкреплением используется для обучения роботов выполнению задач, таких как ходьба по комнате, а также для обучения программных продуктов, таких как AlphaGo игре в го.

Генеративный ИИ

Генеративный ИИ — это класс моделей, которые создают контент на основе пользовательского ввода. Например, генеративный ИИ может создавать уникальные изображения, музыкальные композиции и шутки; он может делать краткие обзоры статей, объяснять, как выполнить задачу, или редактировать фотографии.

Генеративный ИИ может принимать на вход различные данные и создавать на выходе различные результаты, такие как текст, изображения, аудио и видео. Он также может принимать и создавать их комбинации. Например, модель может принять изображение в качестве входных данных и создать изображение и текст в качестве выходных данных, или принять изображение и текст в качестве входных данных и создать видео в качестве выходных данных.

Мы можем обсуждать генеративные модели, рассматривая их входные и выходные данные, обычно обозначаемые как «тип входных данных» — «тип выходных данных». Например, ниже приведён неполный список некоторых входных и выходных данных для генеративных моделей:

Текст в текст
Преобразование текста в изображение
Преобразование текста в видео
Преобразование текста в код
Преобразование текста в речь
Изображение и текст в изображение

В следующей таблице приведены примеры генеративных моделей, их входные данные и возможные выходные данные:

Модель	Вход	Пример выходных данных
Текст в текст	Кто придумал гонку Ле-Ман?	Гонка «24 часа Ле-Мана» была основана Автомобильным клубом Западной Франции (ACO), автомобильной организацией, созданной в 1906 году. Первая гонка состоялась 26 и 27 мая 1923 года на трассе Сарта, дорожной трассе длиной 13,426 километра (8,345 мили), расположенной недалеко от города Ле-Ман во Франции. Первоначально гонка задумывалась как способ популяризации ACO и региона Сарта. Источник: Бард
Преобразование текста в изображение	Инопланетный осьминог пролетает сквозь портал, читая газету.	Источник: Imagen
Преобразование текста в видео	Фотореалистичный плюшевый мишка плавает в океане у берегов Сан-Франциско. Мишка уходит под воду. Мишка продолжает плыть под водой среди разноцветных рыбок. Под водой плавает панда.	Источник: Phenaki
Преобразование текста в код	Напишите цикл на Python, который перебирает список чисел и выводит простые числа.	for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) Источник: Бард
Преобразование изображения в текст		Это фламинго. Они обитают в Карибском море. Источник: Google DeepMind

Как работает генеративный ИИ? В общих чертах, генеративные модели изучают закономерности в данных с целью создания новых, но похожих данных. Генеративные модели выглядят следующим образом:

Комики, которые учатся имитировать других, наблюдая за поведением и манерой речи людей.
Художники, которые учатся писать в определенном стиле, изучая множество картин, написанных в этом стиле.
Кавер-группы, которые учатся звучать как определённая музыкальная группа, слушая много музыки этой группы.

Для получения уникальных и креативных результатов генеративные модели первоначально обучаются с использованием подхода без учителя, при котором модель учится имитировать данные, на которых она обучалась. Иногда модель дополнительно обучается с использованием обучения с учителем или обучения с подкреплением на конкретных данных, связанных с задачами, которые могут быть поставлены перед моделью, например, написание краткого изложения статьи или редактирование фотографии.

Генеративный искусственный интеллект — это быстро развивающаяся технология, в которой постоянно открываются новые области применения. Например, генеративные модели помогают компаниям улучшать изображения товаров в электронной коммерции, автоматически удаляя отвлекающий фон или повышая качество изображений с низким разрешением.

Введение в машинное обучение

Контролируемое обучение

Что такое машинное обучение? Оптимизируйте свои подборки Сохраняйте и классифицируйте контент в соответствии со своими настройками.

Проверьте свои знания

Типы систем машинного обучения

Обучение под наблюдением

Регрессия

Классификация

Проверьте свои знания

Обучение без надзора

Проверьте свои знания

Обучение с подкреплением

Генеративный ИИ

Что такое машинное обучение?