Glossário de machine learning: sistemas de recomendação

Veja nesta página os termos do glossário dos Sistemas de recomendação. Para ver todos os termos do glossário, clique aqui.

C

geração de candidatos

#recsystems

O conjunto inicial de recomendações escolhidas por um sistema de recomendações. Por exemplo, imagine uma livraria que ofereça 100.000 títulos. Essa fase cria uma lista muito menor de livros adequados para um usuário específico, por exemplo, 500. Mas até mesmo 500 livros são muito recomendados para um usuário. As fases posteriores e mais caras de um sistema de recomendação (como pontuação e reclassificação) reduzem essas 500 unidades para um conjunto muito menor e mais útil de recomendações.

filtragem colaborativa

#recsystems

Fazer previsões sobre os interesses de um usuário com base nos interesses de muitos outros usuários. A filtragem colaborativa geralmente é usada em sistemas de recomendação.

I

matriz de itens

#recsystems

Em sistemas de recomendação, uma matriz de vetores de embedding gerados pela fatoração de matriz que contém sinais latentes sobre cada item. Cada linha da matriz de itens contém o valor de um único atributo latente de todos os itens. Por exemplo, considere um sistema de recomendação de filmes. Cada coluna na matriz de itens representa um único filme. Os sinais latentes podem representar gêneros ou serem mais difíceis de interpretar, que envolvem interações complexas entre gênero, estrelas, idade do filme ou outros fatores.

A matriz de itens tem o mesmo número de colunas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes que avalia 10 mil títulos de filmes, a matriz de itens tem 10 mil colunas.

items

#recsystems

Em um sistema de recomendação, as entidades que um sistema recomenda. Por exemplo, vídeos são os itens recomendados por uma loja de vídeos, enquanto livros são itens recomendados por uma livraria.

M

fatoração de matrizes

#recsystems

Em matemática, um mecanismo para encontrar matrizes de um produto de pontos se aproxima de uma matriz de destino.

Em sistemas de recomendação, a matriz de destino geralmente contém classificações de usuários em itens. Por exemplo, a matriz de destino de um sistema de recomendação de filmes pode ser parecida com esta, em que os números inteiros positivos são avaliações de usuários e 0 significa que o usuário não classificou o filme:

  Casablanca A história da Filadélfia Pantera Negra Mulher-Maravilha Ficção polpa
Usuário 1 5 3 0,0 2 0,0
Usuário 2 4.0 0,0 0,0 1 5
Usuário 3 3 1 4.0 5.0 0,0

O sistema de recomendação de filmes tem como objetivo prever classificações do usuário para filmes sem classificação. Por exemplo, o Usuário 1 vai gostar de Black Panther?

Uma abordagem para sistemas de recomendação é usar a fatoração de matriz para gerar as duas matrizes a seguir:

  • Uma matriz de usuários, com o formato do número de usuários X do número de dimensões de embedding.
  • Uma matriz de itens, formato do número de dimensões de embedding X X o número de itens.

Por exemplo, usar a fatoração de matriz nos nossos três usuários e cinco itens poderia gerar a seguinte matriz de usuários e matriz de itens:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

O produto de ponto da matriz do usuário e da matriz do item produz uma matriz de recomendação que contém não apenas as classificações originais do usuário, mas também previsões para os filmes que cada usuário não viu. Por exemplo, considere a avaliação do usuário 1' Casablanca, que foi 5.0. O produto de ponto correspondente a essa célula na matriz de recomendação deve esperar estar em torno de 5, 0 e é:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

E o mais importante, o usuário 1, como Black Panther? O resultado de um produto com três pontos na primeira linha e na terceira coluna gera uma classificação prevista de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

A fatoração de matriz normalmente produz uma matriz de usuário e de item que, em conjunto, são significativamente mais compactas do que a matriz de destino.

R

sistema de recomendação

#recsystems

Um sistema que seleciona para cada usuário um conjunto relativamente pequeno de itens desejados de um grande corpus. Por exemplo, um sistema de recomendações de vídeos pode recomendar dois vídeos de um corpus de 100 mil vídeos, selecionando Casablanca e The Philadelphia Story para um usuário e Wonder Women e Black Panther para outro. Um sistema de recomendação de vídeo pode basear as recomendações em fatores como:

  • Filmes que usuários semelhantes classificaram ou assistiram.
  • Gênero, diretores, atores, grupo demográfico desejado...

nova classificação

#recsystems

O estágio final de um sistema de recomendação, em que os itens marcados podem ser reclassificados de acordo com outro algoritmo (normalmente, não ML). A reclassificação avalia a lista de itens gerados pela fase de pontuação, que realiza ações como:

  • Sem os itens que o usuário já comprou.
  • Aumentar a pontuação de itens mais atualizados.

S

em lote

#recsystems

A parte de um sistema de recomendação que fornece um valor ou classificação para cada item produzido pela fase de geração de candidatos.

U

matriz do usuário

#recsystems

Em sistemas de recomendação, um vetor de embedding gerado pela fatoração de matrizes que contém sinais latentes sobre as preferências do usuário. Cada linha da matriz do usuário contém informações sobre a intensidade relativa de vários sinais latentes para um único usuário. Por exemplo, considere um sistema de recomendação de filmes. Nesse sistema, os sinais latentes na matriz do usuário podem representar o interesse de cada usuário em gêneros específicos ou podem ser mais difíceis de interpretar sinais que envolvem interações complexas entre vários fatores.

A matriz de usuários tem uma coluna para cada atributo latente e uma linha para cada usuário. Ou seja, a matriz do usuário tem o mesmo número de linhas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes para 1.000.000 de usuários, a matriz de usuários terá 1.000.000 de linhas.

W

Mínimo de quadrados quadrados ponderados (WALS)

#recsystems

Um algoritmo para minimizar a função de objetivo durante a fatoração de matriz em sistemas de recomendação, o que permite uma pesação dos exemplos ausentes. O WALS minimiza o erro quadrático ponderado entre a matriz original e a reconstrução, alternando entre a fatoração de linhas e a fatoração de colunas. Cada uma dessas otimizações pode ser resolvida pelo menor número de quadrados otimização de convex. Para saber mais detalhes, consulte o curso de sistemas de recomendação.