Xếp hạng lại

Trong giai đoạn cuối cùng của một hệ thống đề xuất, hệ thống có thể xếp hạng lại các ứng viên để xem xét các tiêu chí hoặc hạn chế khác. Một phương pháp xếp hạng lại là sử dụng các bộ lọc để xoá một số đề xuất.

Một phương pháp xếp hạng lại khác là chuyển đổi điểm số theo cách thủ công do người xếp hạng trả về.

Phần này thảo luận ngắn gọn về tính mới mẻ, sự đa dạng và công bằng. Đây là một số yếu tố có thể giúp cải thiện hệ thống đề xuất của bạn. Một số yếu tố trong số này thường yêu cầu sửa đổi các giai đoạn khác nhau của quá trình. Mỗi phần sẽ cung cấp giải pháp mà bạn có thể áp dụng riêng lẻ hoặc chung.

Độ mới

Hầu hết các hệ thống đề xuất đều hướng đến việc kết hợp thông tin sử dụng mới nhất, chẳng hạn như nhật ký người dùng hiện tại và các mục mới nhất. Việc giữ cho mô hình luôn mới sẽ giúp mô hình đó đưa ra các đề xuất phù hợp.

Giải pháp

  • Chạy lại chương trình đào tạo thường xuyên nhất có thể để tìm hiểu dữ liệu đào tạo mới nhất. Bạn nên bắt đầu chương trình đào tạo để mô hình không phải học lại từ đầu. Việc khởi động ấm có thể làm giảm đáng kể thời gian đào tạo. Ví dụ: trong quá trình phân tích ma trận, hãy khởi động tính năng nhúng cho các mục đã có trong phiên bản trước của mô hình.
  • Tạo "trung bình" người dùng để biểu thị người dùng mới trong mô hình hệ số ma trận. Bạn không cần nhúng video giống nhau cho mỗi người dùng—bạn có thể tạo cụm người dùng dựa trên tính năng người dùng.
  • Sử dụng một DNN, chẳng hạn như mô hình mềm hoặc mô hình hai tháp. Vì mô hình này lấy vectơ tính năng làm dữ liệu đầu vào, nên bạn có thể chạy mô hình này trên một truy vấn hoặc một mục chưa thấy trong quá trình đào tạo.
  • Thêm độ tuổi của tài liệu làm đối tượng. Ví dụ: YouTube có thể thêm độ tuổi của một video hoặc thời gian xem gần đây nhất của một video.

Hình ảnh gồm 4 video đề xuất về cú.

Diversity (Tính đa dạng)

Nếu hệ thống luôn đề xuất các mục là "gần nhất" đối với truy vấn nhúng, các đề xuất có xu hướng rất giống nhau. Việc thiếu tính đa dạng này có thể gây ra trải nghiệm không tốt hoặc gây nhàm chán cho người dùng. Ví dụ: nếu YouTube chỉ đề xuất các video tương tự như video mà người dùng hiện đang xem, chẳng hạn như các video mà không liên quan đến video (như minh họa trong hình minh hoạ), thì người dùng có thể sẽ nhanh chóng mất hứng thú.

Giải pháp

  • Đào tạo nhiều trình tạo ứng viên bằng cách sử dụng các nguồn khác nhau.
  • Đào tạo nhiều người xếp hạng bằng các hàm mục tiêu khác nhau.
  • Xếp hạng lại các mục dựa trên thể loại hoặc siêu dữ liệu khác để đảm bảo tính đa dạng.

Tính công bằng

Mô hình của bạn nên đối xử công bằng với tất cả người dùng. Do đó, hãy đảm bảo mô hình của bạn không nhận ra thành kiến vô thức trong dữ liệu huấn luyện.

Giải pháp

  • Đưa ra những góc nhìn đa dạng trong thiết kế và phát triển.
  • Đào tạo các mô hình máy học trên các tập dữ liệu toàn diện. Thêm dữ liệu phụ trợ khi dữ liệu của bạn quá thưa thớt (ví dụ: khi một số danh mục nhất định không được đại diện rõ ràng).
  • Theo dõi các chỉ số (ví dụ: độ chính xác và lỗi tuyệt đối) trên từng thông tin nhân khẩu học để đề phòng vấn đề sai lệch.
  • Tạo mô hình riêng biệt cho các nhóm chưa được cung cấp đúng mức.