Umieszczanie

Umieszczanie to stosunkowo niska przestrzeń, w której można tłumaczyć wektory wysokowymiarowe. Umieszczone elementy ułatwiają naukę systemów uczących się w przypadku dużych danych wejściowych, takich jak wąskie wektory reprezentujące słowa. W idealnym przypadku osadzony fragment powinien uwzględniać semantykę danych wejściowych, umieszczając semantycznie podobne dane wejściowe w miejscu docelowym. Umieszczone elementy można poznać i ponownie wykorzystać w różnych modelach.

Umieszczanie

  • Wejście: 1 000 000 filmów, które 500 tys. użytkowników obejrzało.
  • Zadanie: polecanie filmów użytkownikom

Aby rozwiązać ten problem, potrzebujemy jakiejś metody, która pozwoli nam określić, które filmy są do siebie podobne.

Lista filmów ułożonych w jednym wierszu od lewej do prawej. Zacznij od lewej i drugiej serii: „Grrek'”,

Ta sama lista filmów na poprzednim slajdzie, ale ułożona na 2 wymiary, na przykład „Szekła” po lewej stronie i powyżej

Działa podobnie jak na poprzednim diagramie, ale z ośmi i etykietami dla każdego kwartyla. Układ filmów jest taki: w pierwszym kwartale w prawym górnym rogu wyświetlane są „Dorośli bloki dorosłych” z filmami „Gwiezdne wojny” i „3. Boże Narodzenie”, a w których filmy są dodawane do filmów – Drugi i prawy dolny kwadrat to filmy dla dorosłych zawierające filmy i filmy, które zostały dodane do kwadratów kanału „Dorosłego artysty”. Trzecie lewy kwadrat to Children Arthouse, na którym znajduje się film „Triploty z Bellville” oraz „Wallace” i „Gromit”. Czwarty i końcowy kwadrat w lewym górnym rogu to Przeboje dziecięce zawierające 3 klocki i filmy „Niesamowite” i „39; Harry Potter” oraz film „Szkoła rocka”.

Takie samo ustawienie jak na ostatnim slajdzie. 'Shrek' 'Bleu' są wyróżnione jako przykłady współrzędnych w platformie osadzania 2D.

  • Zakłada, że zainteresowanie użytkowników filmami jest wyjaśnione przez różne aspekty
  • Każdy film staje się punktem D wymiarów, w którym wartość wymiaru d wskazuje, w jakim stopniu film odpowiada temu aspektowi.
  • Umieszczone elementy można poznać na podstawie danych
  • Nie jest potrzebny oddzielny proces trenowania – wbudowana warstwa jest po prostu ukrytą warstwą z jedną jednostką na wymiar.
  • Informacje nadzorowane (np.użytkownicy, którzy obejrzeli te same 2 filmy) dostosowują w nim umieszczoną treść.
  • Ukryte jednostki zorientują się, jak porządkować elementy w przestrzeni d wymiarowej, by jak najlepiej zoptymalizować końcowy cel.
  • Każdy przykład (wiersz na tej tablicy) to niewielki wektor funkcji (filmów) obejrzanych przez użytkownika.
  • Gęstość symbolizująca ten przykład: (0, 1, 0, 1, 0, 0, 0, 1)

Nie jest wydajny pod względem czasu i miejsca.

Tabela, w której każdy nagłówek kolumny to film, a każdy wiersz reprezentuje użytkownika i obejrzane przez niego filmy.
  • Utwórz słownik słownikowy do mapowania liczby całkowitej na liczbę z zakresu 0, ..., # filmów – 1
  • Skutecznie reprezentuj wąski wektor jako filmy oglądane przez użytkownika. Może to wyglądać tak: Na podstawie pozycji kolumny filmów w krótkim wektorze wyświetlanym po prawej stronie filmy „Triplety z Bellville” i „#39;Wallace” i „Grimé” oraz „#39;Memento&#39 –” można skutecznie reprezentować jako (0, 1, 999999)
Wąski wektor reprezentujący tabelę, z których każda kolumna reprezentuje film i każdy wiersz przedstawia użytkownika. Tabela zawiera filmy z poprzednich diagramów i numerowana od 1 do 999999. Jeśli użytkownik obejrzał film, sprawdzana jest każda komórka w tabeli.

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej wykorzystywany do przewidywania cen sprzedaży domowej

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej wykorzystywany do przewidywania cen sprzedaży domowej (zaznaczone jest ograniczone kodowanie wektorowe)

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej używanej do prognozowania cen sprzedaży domowej (wyróżniona trzywymiarowa warstwa osadzania)

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej używanej do prognozowania cen sprzedaży domowej (wyróżnione są dodatkowe funkcje związane z długością i szerokością geograficzną)

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej wykorzystywany do prognozowania cen sprzedaży domowej (cechy cech przesyłane do kilku ukrytych warstw)

Błąd regresji, aby przewidzieć ceny sprzedaży domowej:

Schemat głębokiej sieci neuronowej używanej do prognozowania cen sprzedaży w domu (wyróżniona głęboka sieć neuronowa)

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej używanych do przewidywania pisma odręcznego

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej wykorzystywany do prognozowania odręcznych cyfr (zaznaczone zakodowane wektorowe wartości kodowania)

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej używanych do przewidywania pisma odręcznego (inne funkcje są wyróżnione)

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej używany do prognozowania odręcznych cyfr (umieszczono trójwymiarowe umieszczenie).

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej używany do przewidywania pisma odręcznego (wyróżnione ukryte warstwy)

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej wykorzystywany do prognozowania odręcznych cyfr (zaznaczona warstwa logiki)

Klasyfikacja wieloklasowa do przewidywania pisma odręcznej:

Schemat głębokiej sieci neuronowej wykorzystywany do prognozowania odręcznych cyfr (zaznaczona w warstwie docelowej)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do przewidywania filmów, które warto polecić

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do prognozowania, które filmy warto polecić (wyróżniona warstwa docelowa)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do prognozowania, które filmy warto polecić (wyróżnienie ograniczonego kodowania wektorowego)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do prognozowania, które filmy warto polecić (wyróżnienie trójwymiarowego osadzenia)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do przewidywania filmów, które warto polecić (inne funkcje są wyróżnione)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do przewidywania filmów, które warto polecić (wyróżnione ukryte warstwy)

Wspólne filtrowanie prognozowanych filmów:

Schemat głębokiej sieci neuronowej używany do prognozowania, które filmy warto polecić (wyróżniona warstwa logiki)

Szczegółowa sieć

  • Każda ukryta jednostka odpowiada wymiarowi (funkcja późniejsza)
  • Wagi brzegowe filmu i ukrytej warstwy to wartości współrzędnych
  • Schemat drzewa głębokiej sieci neuronowej z węzłami w najniższej warstwie połączony z 3 punktami w następnej górnej warstwie

Widok geometryczny. Umieszczanie pojedynczego filmu

Punkt w 3-wymiarowym miejscu odpowiadającym wężkowi warstwy warstwy dolnej w diagramie sieci neuronowej.
  • Osadzenia o wyższych wymiarach mogą lepiej odzwierciedlać zależności między wartościami wejściowymi
  • Więcej wymiarów zwiększa jednak ryzyko zbytniego dopasowania i powoduje wolniejsze treningi.
  • Ekstremalna zasada (dobrze nadaje się na początek, ale należy do niej dostosowywać dane):
  • $$ dimensions \approx \sqrt[4]{possible\;values} $$
  • Umieszczone elementy map (np. filmy, tekst itp.) na rzeczywistych obiektach w niskich wymiarach w taki sposób, że podobne elementy są blisko siebie
  • Osadzenia można również stosować do gęstych danych (np.dźwięku), aby utworzyć istotne dane dotyczące podobieństwa.
  • Wspólne umieszczanie różnych typów danych (np. tekstu, obrazów, plików audio itp.) określa podobieństwo między nimi