Вложение — это относительно низкоразмерное пространство, в которое можно переводить многомерные векторы. Вложения упрощают машинное обучение на больших входных данных, таких как разреженные векторы, представляющие слова. В идеале вложение фиксирует некоторую семантику входных данных, размещая семантически похожие входные данные близко друг к другу в пространстве встраивания. Вложение можно изучить и повторно использовать в моделях.
Вложения
Мотивация от совместной фильтрации
- Исходные данные: 1 000 000 фильмов, которые выбрали для просмотра 500 000 пользователей.
- Задача: Рекомендовать фильмы пользователям
Чтобы решить эту проблему, необходим какой-то метод, чтобы определить, какие фильмы похожи друг на друга.
Организация фильмов по сходству (1d)
Организация фильмов по сходству (2d)
Двумерное встраивание
Двумерное встраивание
d-мерные вложения
- Предполагается, что интерес пользователей к фильмам можно грубо объяснить d аспектами.
- Каждый фильм становится d-мерной точкой, где значение в измерении d показывает, насколько фильм соответствует этому аспекту.
- Вложения можно узнать из данных
Изучение встраивания в глубокую сеть
- Нет необходимости в отдельном процессе обучения — слой внедрения — это просто скрытый слой с одной единицей измерения в каждом измерении.
- Контролируемая информация (например, пользователи смотрели одни и те же два фильма) адаптирует изученные вложения для желаемой задачи.
- Интуитивно скрытые единицы обнаруживают, как организовать элементы в d-мерном пространстве таким образом, чтобы наилучшим образом оптимизировать конечную цель.
Входное представление
- Каждый пример (строка в этой матрице) представляет собой разреженный вектор функций (фильмов), которые смотрел пользователь.
- Плотное представление этого примера как: (0, 1, 0, 1, 0, 0, 0, 1)
Неэффективен с точки зрения пространства и времени.

Входное представление
- Создайте словарь, сопоставляющий каждую функцию с целым числом от 0, ..., # фильмов - 1
- Эффективно представляйте разреженный вектор только как просмотренные пользователем фильмы. Это может быть представлено как:

Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Задача регрессии для прогнозирования цен продажи жилья:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Мультиклассовая классификация для предсказания рукописной цифры:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Слой встраивания в глубокую сеть
Совместная фильтрация для прогнозирования рекомендуемых фильмов:
Соответствие геометрическому виду
Глубокая сеть
- Каждая из скрытых единиц соответствует измерению (скрытая функция)
- Веса краев между фильмом и скрытым слоем являются значениями координат.
Геометрический вид встраивания одного фильма
Выбор количества вложений
- Вложения более высокой размерности могут более точно представлять отношения между входными значениями.
- Но большее количество измерений увеличивает вероятность переобучения и приводит к более медленному обучению.
- Эмпирическое практическое правило (хорошая отправная точка, но его следует настроить с использованием данных проверки): $$ dimensions \approx \sqrt[4]{possible\;values} $$
Вложения как инструмент
- Вложения отображают элементы (например, фильмы, текст и т. д.) в низкоразмерные реальные векторы таким образом, что похожие элементы находятся близко друг к другу.
- Вложения также можно применять к плотным данным (например, аудио) для создания значимой метрики сходства.
- Совместное встраивание различных типов данных (например, текст, изображения, аудио и т. д.) определяет сходство между ними.