Bảng thuật ngữ về học máy: Hệ thống đề xuất

Trang này chứa các thuật ngữ trong bảng thuật ngữ của Hệ thống đề xuất. Để biết tất cả các thuật ngữ trong bảng thuật ngữ, hãy nhấp vào đây.

C

tạo ứng viên

#recsystems

Nhóm đề xuất ban đầu do hệ thống đề xuất chọn. Ví dụ: hãy xem xét một nhà sách cung cấp 100.000 đầu sách. Giai đoạn tạo đề xuất sẽ tạo ra một danh sách nhỏ hơn nhiều các cuốn sách phù hợp với một người dùng cụ thể, chẳng hạn như 500 cuốn. Nhưng ngay cả 500 cuốn sách cũng là quá nhiều để đề xuất cho người dùng. Các giai đoạn tiếp theo, tốn kém hơn, của hệ thống đề xuất (chẳng hạn như tính điểmđặt lại thứ hạng) sẽ giảm 500 giai đoạn đó xuống một nhóm đề xuất nhỏ hơn và hữu ích hơn nhiều.

lọc cộng tác

#recsystems

Đưa ra dự đoán về mối quan tâm của một người dùng dựa trên mối quan tâm của nhiều người dùng khác. Tính năng lọc cộng tác thường được sử dụng trong hệ thống đề xuất.

I

ma trận mục

#recsystems

Trong hệ thống đề xuất, một ma trận vectơ nhúng được tạo bằng cách phân tích ma trận chứa các tín hiệu ẩn về từng mục. Mỗi hàng của ma trận mục chứa giá trị của một tính năng ẩn duy nhất cho tất cả các mục. Chẳng hạn, bạn có thể cân nhắc đến một hệ thống đề xuất phim. Mỗi cột trong ma trận mục đại diện cho một bộ phim. Các tín hiệu tiềm ẩn có thể đại diện cho thể loại hoặc có thể là các tín hiệu khó hiểu hơn, liên quan đến những tương tác phức tạp giữa thể loại, ngôi sao, độ tuổi của phim hoặc các yếu tố khác.

Ma trận mục có số lượng cột bằng với ma trận mục tiêu đang được phân tích thành nhân tử. Ví dụ: trong một hệ thống đề xuất phim đánh giá 10.000 tựa phim, ma trận mục sẽ có 10.000 cột.

items

#recsystems

Trong hệ thống đề xuất, các thực thể mà hệ thống đề xuất. Ví dụ: video là các mặt hàng mà cửa hàng video đề xuất, còn sách là các mặt hàng mà cửa hàng sách đề xuất.

M

phân tích ma trận thành thừa số

#recsystems

Trong toán học, đó là một cơ chế để tìm ma trận có tích điểm gần đúng với một ma trận mục tiêu.

Trong hệ thống đề xuất, ma trận mục tiêu thường chứa điểm xếp hạng của người dùng cho các mục. Ví dụ: ma trận mục tiêu của một hệ thống đề xuất phim có thể có dạng như sau, trong đó số nguyên dương là điểm xếp hạng từ người dùng và 0 có nghĩa là người dùng chưa xếp hạng bộ phim đó:

  Casablanca Câu chuyện của Phi thuyền Black Panther (Chiến binh Báo Đen) Nữ thần chiến binh Tiểu thuyết bột
Người dùng 1 5 3 0,0 2 0,0
Người dùng 2 4 0,0 0,0 1 5
Người dùng 3 3 1 4 5 0,0

Hệ thống đề xuất phim nhằm dự đoán xếp hạng của người dùng cho các bộ phim chưa xếp hạng. Ví dụ: Người dùng 1 có thích Black Panther không?

Một phương pháp dành cho các hệ thống đề xuất là sử dụng phương pháp phân tích ma trận để tạo 2 ma trận sau:

  • Ma trận người dùng, có hình dạng bằng số người dùng X số thứ nguyên nhúng.
  • Một ma trận mục, có hình dạng là số lượng thứ nguyên nhúng X số lượng mục.

Ví dụ: sử dụng tính năng phân tích ma trận cho 3 người dùng và 5 mục có thể tạo ra ma trận người dùng và ma trận mục sau đây:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Tích điểm của ma trận người dùng và ma trận mục tạo ra một ma trận đề xuất không chỉ chứa điểm xếp hạng ban đầu của người dùng mà còn chứa thông tin dự đoán về những bộ phim mà mỗi người dùng chưa xem. Ví dụ: hãy xem xét điểm xếp hạng Casablanca của Người dùng 1, là 5.0. Sản phẩm chấm tương ứng với ô đó trong ma trận đề xuất sẽ ở khoảng 5.0 và như sau:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Quan trọng hơn, Người dùng 1 có thích Black Panther không? Việc lấy sản phẩm dấu chấm tương ứng với hàng đầu tiên và cột thứ ba sẽ cho ra điểm xếp hạng dự đoán là 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Việc phân tích nhân tử của ma trận thường tạo ra một ma trận người dùng và ma trận mục, cùng với nhau, nhỏ gọn hơn đáng kể so với ma trận mục tiêu.

R

hệ thống đề xuất

#recsystems

Một hệ thống chọn cho mỗi người dùng một tập hợp mục tương đối nhỏ mong muốn từ một tập dữ liệu lớn. Ví dụ: hệ thống đề xuất video có thể đề xuất 2 video trong tập hợp 100.000 video, chọn CasablancaThe Philior Story cho một người dùng, và Wonder WomenBlack Panther cho một người dùng khác. Một hệ thống đề xuất video có thể đưa ra các đề xuất dựa trên các yếu tố như:

  • Phim mà những người dùng tương tự đã xếp hạng hoặc xem.
  • Thể loại, đạo diễn, diễn viên, đối tượng nhân khẩu học mục tiêu...

đang xếp hạng lại

#recsystems

Giai đoạn cuối cùng của hệ thống đề xuất, trong đó các mục được tính điểm có thể được chấm điểm lại theo một số thuật toán khác (thường là không phải học máy). Quá trình xếp hạng lại sẽ đánh giá danh sách các mục được tạo trong giai đoạn tính điểm, thực hiện những hành động như:

  • Loại bỏ các mặt hàng mà người dùng đã mua.
  • Tăng điểm số của các mặt hàng mới hơn.

S

ghi điểm

#recsystems

Một phần của hệ thống đề xuất cung cấp giá trị hoặc thứ hạng cho mỗi mục do giai đoạn tạo đề xuất tạo ra.

U

ma trận người dùng

#recsystems

Trong hệ thống đề xuất, một vectơ nhúng được tạo bằng cách phân tích ma trận chứa các tín hiệu tiềm ẩn về lựa chọn ưu tiên của người dùng. Mỗi hàng của ma trận người dùng chứa thông tin về độ mạnh tương đối của nhiều tín hiệu ẩn đối với một người dùng. Chẳng hạn, bạn có thể cân nhắc đến một hệ thống đề xuất phim. Trong hệ thống này, các tín hiệu ẩn trong ma trận người dùng có thể đại diện cho mối quan tâm của từng người dùng đối với một số thể loại cụ thể, hoặc có thể là những tín hiệu khó hiểu hơn liên quan đến những hoạt động tương tác phức tạp trên nhiều yếu tố.

Ma trận người dùng có một cột cho mỗi tính năng tiềm ẩn và một hàng cho mỗi người dùng. Tức là ma trận người dùng có cùng số hàng với ma trận mục tiêu đang được phân tích thành nhân tử. Ví dụ: trong một hệ thống đề xuất phim cho 1.000.000 người dùng, ma trận người dùng sẽ có 1.000.000 hàng.

W

Các hình vuông nhỏ nhất xen kẽ có trọng số (WALS)

#recsystems

Một thuật toán giúp giảm thiểu hàm mục tiêu trong quá trình phân tích ma trận trong hệ thống đề xuất, cho phép giảm trọng số các ví dụ bị thiếu. WALS giảm thiểu sai số bình phương có trọng số giữa ma trận ban đầu và việc tái cấu trúc bằng cách xen kẽ giữa việc xác định thừa số hàng và phân tích cột. Mỗi cách tối ưu hoá này có thể được giải bằng bình phương tối thiểu tối ưu hoá lồi. Để biết thông tin chi tiết, hãy xem khoá học về Hệ thống đề xuất.