Machine Learning | Google for Developers

Эта страница переведена с помощью Cloud Translation API.

Более сложные пересечения функций

Теперь давайте поиграем с некоторыми расширенными комбинациями перекрестных функций. Набор данных в этом упражнении на игровой площадке немного напоминает шумное яблочко из игры в дартс с синими точками в середине и оранжевыми точками во внешнем кольце.

Нажмите значок плюса, чтобы получить объяснение визуализации модели.

Каждое упражнение Playground отображает визуализацию текущего состояния модели. Например, вот визуализация:

Обратите внимание на следующее относительно визуализации модели:

Каждая ось представляет собой конкретную функцию. В случае спама и не спама такими характеристиками могут быть количество слов и количество получателей электронного письма.
Примечание. Соответствующие значения оси будут зависеть от данных объекта. Показанные выше значения оси не имеют смысла для количества слов или количества получателей, поскольку ни одно из них не может быть отрицательным.
Каждая точка отображает значения функций для одного примера данных, например электронного письма.
Цвет точки обозначает класс, к которому принадлежит пример. Например, синие точки могут обозначать электронные письма, не являющиеся спамом, а оранжевые точки — спам-сообщения.
Цвет фона представляет собой предсказание модели о том, где следует найти примеры этого цвета. Синий фон вокруг синей точки означает, что модель правильно предсказывает этот пример. И наоборот, оранжевый фон вокруг синей точки означает, что модель неправильно предсказывает этот пример.
Фоновый синий и оранжевый цвета масштабируются. Например, левая сторона визуализации сплошного синего цвета, но постепенно становится белой в центре визуализации. Вы можете думать об интенсивности цвета как о уверенности модели в своем предположении. Сплошной синий цвет означает, что модель очень уверена в своем предположении, а голубой означает, что модель менее уверена. (Визуализация модели, показанная на рисунке, плохо прогнозирует.)

Используйте визуализацию, чтобы оценить прогресс вашей модели. («Отлично — большинство синих точек имеют синий фон» или «О нет! Синие точки имеют оранжевый фон».) Помимо цветов, Playground также отображает текущие потери модели в числовом виде. («О нет! Убытки растут, а не падают».)

Задача 1: Запустите эту линейную модель, как указано. Потратьте минуту или две (но не больше), пробуя разные настройки скорости обучения, чтобы увидеть, сможете ли вы найти какие-либо улучшения. Может ли линейная модель дать эффективные результаты для этого набора данных?

Задача 2. Теперь попробуйте добавить функции для разных продуктов, например x ₁ x ₂ , чтобы оптимизировать производительность.

Какие функции помогают больше всего?
Какую лучшую производительность вы можете получить?

Задача 3. Если у вас есть хорошая модель, проверьте выходную поверхность модели (показана цветом фона).

Похоже ли это на линейную модель?
Как бы вы охарактеризовали модель?

(Ответы приведены сразу под упражнением.)

Нажмите значок плюса для ответа на задание 1.

Нет. Линейная модель не может эффективно моделировать этот набор данных. Снижение скорости обучения уменьшает потери, но потери по-прежнему сходятся к неприемлемо высокому значению.

Нажмите значок плюса, чтобы получить ответ на задание 2.

Наборы данных игровой площадки генерируются случайным образом. Следовательно, наши ответы не всегда могут точно совпадать с вашими. Фактически, если вы регенерируете набор данных между прогонами, ваши собственные результаты не всегда будут точно совпадать с предыдущими прогонами. Тем не менее, вы получите лучшие результаты, выполнив следующие действия:

Использование x ₁ ² и x ₂ ² в качестве пересечений признаков. (Добавление x ₁ x ₂ в качестве перекрестия объектов, похоже, не помогает.)
Снижение скорости обучения , возможно, до 0,001 .

Нажмите значок плюса, чтобы получить ответ на задание 3.

Выходная поверхность модели не похожа на линейную модель. Скорее, он выглядит эллиптическим.