Эта страница переведена с помощью Cloud Translation API.

Вложения

Вложение — это относительно низкоразмерное пространство, в которое можно переводить многомерные векторы. Вложения упрощают машинное обучение на больших входных данных, таких как разреженные векторы, представляющие слова. В идеале вложение фиксирует некоторую семантику входных данных, размещая семантически похожие входные данные близко друг к другу в пространстве встраивания. Вложение можно изучить и повторно использовать в моделях.

Вложения

Мотивация от совместной фильтрации

Исходные данные: 1 000 000 фильмов, которые выбрали для просмотра 500 000 пользователей.
Задача: Рекомендовать фильмы пользователям

Чтобы решить эту проблему, необходим какой-то метод, чтобы определить, какие фильмы похожи друг на друга.

Организация фильмов по сходству (1d)

Список фильмов, упорядоченный в одну строку слева направо. Начиная с левого: «Шрек», «Суперсемейка», «Тройняшки из Бельвиля», «Гарри Поттер», «Звездные войны», «Синий», «Возрождение Темного рыцаря» и «Помни».

Организация фильмов по сходству (2d)

Тот же список фильмов на предыдущем слайде, но в двух измерениях, например, «Шрек» находится слева и выше от «Суперсемейки».

Двумерное встраивание

Та же аранжировка, что и на последнем слайде. «Шрек» и «Блю» выделены как примеры их координат в плоскости вложения 2d.

d-мерные вложения

Предполагается, что интерес пользователей к фильмам можно грубо объяснить d аспектами.
Каждый фильм становится d-мерной точкой, где значение в измерении d показывает, насколько фильм соответствует этому аспекту.
Вложения можно узнать из данных

Изучение встраивания в глубокую сеть

Нет необходимости в отдельном процессе обучения — слой внедрения — это просто скрытый слой с одной единицей измерения в каждом измерении.
Контролируемая информация (например, пользователи смотрели одни и те же два фильма) адаптирует изученные вложения для желаемой задачи.
Интуитивно скрытые единицы обнаруживают, как организовать элементы в d-мерном пространстве таким образом, чтобы наилучшим образом оптимизировать конечную цель.

Входное представление

Каждый пример (строка в этой матрице) представляет собой разреженный вектор функций (фильмов), которые смотрел пользователь.
Плотное представление этого примера как: (0, 1, 0, 1, 0, 0, 0, 1)

Неэффективен с точки зрения пространства и времени.

Таблица, в которой каждый заголовок столбца представляет собой фильм, а каждая строка представляет пользователя и фильмы, которые он смотрел.

Входное представление

Создайте словарь, сопоставляющий каждую функцию с целым числом от 0, ..., # фильмов - 1
Эффективно представляйте разреженный вектор только как просмотренные пользователем фильмы. Это может быть представлено как:

Разреженный вектор, представленный в виде таблицы, в которой каждый столбец представляет фильм, а каждая строка представляет пользователя. Таблица содержит фильмы из предыдущих диаграмм и пронумерована от 1 до 999999. Каждая ячейка таблицы проверяется, смотрел ли пользователь фильм.

Слой встраивания в глубокую сеть

Задача регрессии для прогнозирования цен продажи жилья:

Схема глубокой нейронной сети, используемой для прогнозирования цен при продаже дома.

Слой встраивания в глубокую сеть

Задача регрессии для прогнозирования цен продажи жилья:

Схема глубокой нейронной сети, используемой для прогнозирования цен при продаже дома (выделено разреженное векторное кодирование)

Слой встраивания в глубокую сеть

Задача регрессии для прогнозирования цен продажи жилья:

Диаграмма глубокой нейронной сети, используемой для прогнозирования цен при продаже дома (выделен скрытый трехмерный слой встраивания)

Слой встраивания в глубокую сеть

Задача регрессии для прогнозирования цен продажи жилья:

Диаграмма глубокой нейронной сети, используемой для прогнозирования цен при продаже дома (выделены дополнительные функции ввода широты и долготы)

Слой встраивания в глубокую сеть

Задача регрессии для прогнозирования цен продажи жилья:

Диаграмма глубокой нейронной сети, используемой для прогнозирования цен при продаже дома (выделены входные функции, поступающие в несколько скрытых слоев)