Lọc dựa trên nội dung

Tính năng lọc dựa trên nội dung sử dụng các tính năng về mục để đề xuất các mục khác tương tự như nội dung người dùng thích, dựa trên các thao tác trước đó hoặc phản hồi rõ ràng của người dùng.

Để minh hoạ tính năng lọc dựa trên nội dung, hãy thiết kế một số tính năng cho Cửa hàng Google Play. Hình sau đây cho thấy một ma trận tính năng, trong đó mỗi hàng biểu thị một ứng dụng và mỗi cột biểu thị một tính năng. Các tính năng có thể bao gồm danh mục (chẳng hạn như Giáo dục, Phổ thông, Y tế), nhà xuất bản ứng dụng và nhiều tính năng khác. Để đơn giản hoá, giả sử ma trận tính năng này là tệp nhị phân: giá trị khác 0 nghĩa là ứng dụng có tính năng đó.

Bạn cũng biểu thị người dùng trong cùng một không gian tính năng. Một số tính năng liên quan đến người dùng có thể được cung cấp rõ ràng bởi người dùng. Ví dụ: người dùng chọn "Ứng dụng giải trí" trong hồ sơ của mình. Các tính năng khác có thể được ngầm định, dựa trên các ứng dụng mà họ đã cài đặt trước đó. Ví dụ: người dùng cài đặt một ứng dụng khác do Science R Us phát hành.

Mô hình này nên đề xuất các mục có liên quan đến người dùng này. Để làm như vậy, trước tiên, bạn phải chọn một chỉ số tương tự (ví dụ: sản phẩm có dấu chấm). Sau đó, bạn phải thiết lập hệ thống để chấm điểm cho từng mục đề xuất theo chỉ số tương tự này. Xin lưu ý rằng các đề xuất dành riêng cho người dùng này, vì mô hình không sử dụng bất kỳ thông tin nào về người dùng khác.

Hình ảnh ma trận hiển thị một người dùng và ứng dụng mà có thể được đề xuất

Sử dụng sản phẩm dấu chấm làm thước đo mức độ tương đồng

Hãy xem xét trường hợp người dùng nhúng \(x\) và nhúng ứng dụng \(y\) đều là vectơ nhị phân. Kể từ\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), một tính năng xuất hiện trong cả \(x\) và \(y\) đóng góp 1 vào tổng cộng. Nói cách khác, \(\langle x, y \rangle\) là số lượng tính năng hoạt động đồng thời trong cả hai vectơ. Sau đó, sản phẩm có dấu chấm cao sẽ biểu thị các tính năng phổ biến hơn, do đó tính tương đồng cao hơn.

Hãy tự mình trải nghiệm!

Tính toán tích số chấm cho mỗi ứng dụng trong bài toán trước về ứng dụng. Sau đó, hãy dùng thông tin đó để trả lời câu hỏi dưới đây:

Chúng tôi nên đề xuất ứng dụng nào?
Ứng dụng giáo dục do Science R Us tạo ra.
Bạn đã đúng! Mặt hàng này có sản phẩm có dấu chấm cao nhất ở mức 2. Người dùng của chúng tôi thực sự thích các ứng dụng khoa học và giáo dục.
Ứng dụng y tế do Healthcare tạo.
Ứng dụng này chấm 1. Đây không phải là đề xuất tồi tệ nhất mà hệ thống của chúng tôi đưa ra, nhưng chắc chắn không phải là tốt nhất.
Ứng dụng thông thường do TimeFoundtr tạo ra.
Ứng dụng này thực sự có sản phẩm chấm thấp nhất bằng 0. Người dùng của chúng tôi không quan tâm đến các ứng dụng phổ biến như trò chơi.