Glossário de machine learning: sistemas de recomendação

Esta página contém termos de glossário dos sistemas de recomendação. Para ver todos os termos do glossário, clique aqui.

C

geração de candidatos

#recsystems

O conjunto inicial de recomendações escolhidas por um sistema de recomendação. Por exemplo, considere uma livraria que oferece 100.000 títulos. A fase de geração de candidatos cria uma lista muito menor de livros adequados para um determinado usuário, digamos 500. Mas mesmo 500 livros é muito demais para recomendar a um usuário. As fases subsequentes e mais caras de um sistema de recomendação (como pontuação e reclassificação) reduzem essas 500 para um conjunto de recomendações muito menor e mais útil.

filtragem colaborativa

#recsystems

Fazer previsões sobre os interesses de um usuário com base nos interesses de muitos outros. A filtragem colaborativa é muito usada em sistemas de recomendação.

I

matriz de itens

#recsystems

Em sistemas de recomendação, uma matriz de vetores de incorporação gerados pela fatoração de matrizes que contém sinais latentes sobre cada item. Cada linha da matriz de itens contém o valor de um único atributo latente para todos os itens. Por exemplo, considere um sistema de recomendação de filmes. Cada coluna na matriz de itens representa um único filme. Os sinais latentes podem representar gêneros ou ser mais difíceis de interpretar que envolvem interações complexas entre gênero, estrelas, idade do filme ou outros fatores.

A matriz de itens tem o mesmo número de colunas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes que avalia 10 mil títulos de filmes, a matriz de itens terá 10 mil colunas.

items

#recsystems

Em um sistema de recomendação, as entidades que um sistema recomenda. Por exemplo, vídeos são os itens que uma locadora de vídeos recomenda, enquanto livros são os itens que uma livraria recomenda.

M

fatoração de matrizes

#recsystems

Em matemática, um mecanismo para encontrar as matrizes cujo produto escalar se aproxima de uma matriz de destino.

Em sistemas de recomendação, a matriz de destino geralmente contém classificações dos usuários em itens. Por exemplo, a matriz de destino de um sistema de recomendação de filmes pode ser semelhante à seguinte, em que os números inteiros positivos são as avaliações dos usuários e 0 significa que o usuário não avaliou o filme:

  Casablanca A história da Filadélfia Pantera Negra Mulher-Maravilha Ficção pulp
Usuário 1 5,0 3.0 0,0 2.0 0,0
Usuário 2 4.0 0,0 0,0 1.0 5,0
Usuário 3 3.0 1.0 4.0 5.0 0,0

O sistema de recomendação de filmes tem como objetivo prever as classificações de usuários para filmes sem classificação. Por exemplo, o Usuário 1 vai gostar de Pantera Negra?

Uma abordagem para sistemas de recomendação é usar fatoração de matrizes para gerar as duas matrizes a seguir:

  • Uma matriz de usuários, definida como o número de usuários X o número de dimensões de embedding.
  • Uma matriz de itens, moldada como o número de dimensões de embedding X o número de itens.

Por exemplo, usar a fatoração de matrizes em nossos três usuários e cinco itens pode gerar a seguinte matriz de usuário e de item:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

O produto escalar da matriz de usuário e de item gera uma matriz de recomendação que contém não apenas as classificações originais dos usuários, mas também previsões para os filmes que cada usuário nunca viu. Por exemplo, considere a classificação do Usuário 1 de Casablanca, que era 5,0. O produto escalar correspondente a essa célula na matriz de recomendação deve estar em torno de 5, 0 e é:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

E o mais importante: o Usuário 1 gostará de Pantera Negra? Pegar o produto escalar correspondente à primeira linha e à terceira coluna gera uma classificação prevista de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Normalmente, a fatoração de matrizes produz uma matriz de usuário e uma matriz de itens que, juntas, são significativamente mais compactas do que a matriz de destino.

R

sistema de recomendação

#recsystems

Um sistema que seleciona para cada usuário um conjunto relativamente pequeno de itens desejáveis de um grande corpus. Por exemplo, um sistema de recomendação de vídeos pode recomendar dois vídeos de um corpus de 100 mil vídeos, selecionando Casablanca e A História da Filadélfia para um usuário e Mulheres Maravilha e Pantera Negra para outro. Um sistema de recomendação de vídeos pode basear as recomendações em fatores como:

  • Filmes avaliados ou assistidos por usuários semelhantes.
  • Gênero, diretores, atores, público-alvo...

reclassificação

#recsystems

O estágio final de um sistema de recomendação, em que os itens pontuados podem ser avaliados novamente de acordo com algum outro algoritmo (geralmente que não seja de ML). A reclassificação avalia a lista de itens gerada pela fase de pontuação, realizando ações como:

  • Eliminar itens que o usuário já comprou.
  • Aumentar a pontuação dos itens mais recentes.

S

em lote

#recsystems

A parte de um sistema de recomendação que fornece um valor ou classificação para cada item produzido pela fase de geração de candidatos.

U

matriz de usuários

#recsystems

Em sistemas de recomendação, um vetor de incorporação gerado por fatoração de matrizes (link em inglês) que contém sinais latentes sobre as preferências do usuário. Cada linha da matriz do usuário contém informações sobre a força relativa de vários sinais latentes para um único usuário. Por exemplo, considere um sistema de recomendação de filmes. Nesse sistema, os sinais latentes na matriz do usuário podem representar o interesse de cada usuário em gêneros específicos ou ser sinais mais difíceis de interpretar que envolvem interações complexas em vários fatores.

A matriz de usuário tem uma coluna para cada atributo latente e uma linha para cada usuário. Ou seja, a matriz do usuário tem o mesmo número de linhas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes para 1.000.000 de usuários, a matriz de usuários terá 1.000.000 linhas.

W

Mínimos quadrados alternados ponderados (WALS)

#recsystems

Um algoritmo para minimizar a função objetiva durante a fatoração de matrizes em sistemas de recomendação, o que permite uma redução dos exemplos ausentes. O WALS minimiza o erro quadrático ponderado entre a matriz original e a reconstrução, alternando entre a correção da fatoração de linhas e de colunas. Cada uma dessas otimizações pode ser resolvida usando a otimização convexa de mínimos quadrados. Para mais detalhes, consulte o curso "Sistemas de recomendação".