Nhúng là một không gian tương đối thấp để bạn có thể dịch các vectơ phương diện cao. Việc nhúng sẽ giúp bạn dễ dàng thực hiện việc học máy trên các đầu vào lớn như vectơ thưa thớt đại diện cho các từ. Lý tưởng nhất là việc nhúng một số ngữ nghĩa của đầu vào bằng cách đặt các đầu vào tương tự về mặt ngữ nghĩa gần nhau trong không gian nhúng. Bạn có thể tìm hiểu và sử dụng lại tính năng nhúng trên các mô hình.
Nhúng
Tạo động lực từ việc lọc cộng tác
- Nhập: 1.000.000 phim mà 500.000 người dùng đã chọn xem
- Nhiệm vụ: Đề xuất phim cho người dùng
Để giải quyết vấn đề này, cần phải có một số phương pháp để xác định các bộ phim nào tương tự nhau.
Sắp xếp phim theo chủ đề tương tự (1d)
Sắp xếp phim theo chủ đề Tương tự (2d)
Nhúng hai chiều
Nhúng hai chiều
D-Thứ nguyên Nhúng
- Giả sử sự quan tâm của người dùng về phim có thể được giải thích khái quát qua các khía cạnh d
- Mỗi bộ phim trở thành một điểm d chiều mà giá trị trong phương diện d đại diện cho mức độ mà bộ phim vừa với khung hình đó
- Nhúng có thể tìm hiểu từ dữ liệu
Tìm hiểu cách nhúng video trong mạng sâu
- Không cần quá trình đào tạo riêng biệt – lớp nhúng chỉ là một lớp ẩn với một đơn vị mỗi phương diện
- Thông tin được giám sát (ví dụ: người dùng xem hai bộ phim giống nhau) điều chỉnh các nội dung nhúng đã học cho nhiệm vụ mong muốn
- Các đơn vị ẩn sẽ trực quan khám phá cách sắp xếp các mục theo không gian chiều theo cách tối ưu hoá tốt nhất để đạt được mục tiêu cuối cùng
Đại diện đầu vào
- Mỗi ví dụ (một hàng trong ma trận này) là một vectơ tính năng thưa thớt (phim) mà người dùng đã xem
- Ví dụ về cách biểu thị dày như sau: (0, 1, 0, 1, 0, 0, 0, 1)
Không hiệu quả về mặt không gian và thời gian.
Đại diện đầu vào
- Xây dựng từ điển ánh xạ từng tính năng thành số nguyên từ 0, ..., # phim - 1
- Trình bày hiệu quả vectơ thưa thớt như những bộ phim mà người dùng đã xem. URL này có thể được thể hiện dưới dạng:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Vấn đề hồi quy để dự đoán giá bán nhà:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Cách phân loại nhiều lớp để dự đoán một chữ số viết tay:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Lớp nhúng trong mạng sâu
Lọc cộng tác để dự đoán các phim nên đề xuất:
Tương ứng với Chế độ xem hình học
Mạng sâu
- Mỗi đơn vị bị ẩn tương ứng với một phương diện (tính năng tiềm ẩn)
- Trọng số cạnh giữa phim và lớp ẩn là giá trị tọa độ
Chế độ xem hình học của một video nhúng
Chọn số lần nhúng nhúng
- Các video nhúng có chiều cao hơn có thể thể hiện chính xác hơn mối quan hệ giữa các giá trị đầu vào
- Tuy nhiên, nhiều phương diện hơn làm tăng cơ hội tập luyện quá mức và dẫn đến quá trình đào tạo chậm hơn
- Quy tắc theo kinh nghiệm (điểm khởi đầu tốt nhưng nên được điều chỉnh bằng cách sử dụng dữ liệu xác thực): $$ dimensions \approx \sqrt[4]{possible\;values} $$
Nhúng dưới dạng Công cụ
- Nhúng các mục bản đồ (ví dụ: phim, văn bản,...) vào vectơ thực có kích thước thấp theo cách mà các mục tương tự gần nhau
- Bạn cũng có thể áp dụng nhúng cho dữ liệu dày đặc (ví dụ: âm thanh) để tạo chỉ số tương đồng có ý nghĩa
- Kết hợp nhiều loại dữ liệu (ví dụ: văn bản, hình ảnh, âm thanh, ...) giống nhau giữa các loại dữ liệu này