Glossário de machine learning: sistemas de recomendação

Esta página contém termos do glossário dos sistemas de recomendação. Para todos os termos do glossário, clique aqui.

C

geração de candidatos

#recsystems

O conjunto inicial de recomendações escolhidas por um sistema de recomendação. Por exemplo, pense em uma livraria que oferece 100.000 títulos. A fase de geração de candidatos cria uma lista muito menor de livros adequados para um determinado usuário, por exemplo, 500. Mas até mesmo 500 livros é demais para ser recomendado a um usuário. As fases mais caras de um sistema de recomendação (como pontuação e reclassificação) reduzem essas 500 para um conjunto de recomendações muito menor e mais útil.

filtragem colaborativa

#recsystems

Fazer previsões sobre os interesses de um usuário com base nos interesses de muitos outros usuários. A filtragem colaborativa geralmente é usada em sistemas de recomendação.

I

matriz de itens

#recsystems

Em sistemas de recomendação, uma matriz de vetores de embedding gerados pela fatoração de matriz que contém sinais latentes sobre cada item. Cada linha da matriz de itens contém o valor de um único recurso latente para todos os itens. Por exemplo, considere um sistema de recomendação de filmes. Cada coluna na matriz de itens representa um único filme. Os sinais latentes podem representar gêneros ou podem ser mais difíceis de interpretar, envolvendo interações complexas entre gênero, estrelas, idade do filme ou outros fatores.

A matriz de itens tem o mesmo número de colunas da matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes que avalia 10.000 títulos de filmes, a matriz de itens terá 10.000 colunas.

items

#recsystems

Em um sistema de recomendação, são as entidades recomendadas por um sistema. Por exemplo, vídeos são os itens recomendados por uma loja de vídeo, enquanto livros são recomendados por uma livraria.

M

fatoração de matrizes

#recsystems

Na matemática, um mecanismo para encontrar as matrizes cujo produto de ponto se aproxima de uma matriz de destino.

Nos sistemas de recomendação, a matriz de destino geralmente contém as avaliações dos usuários sobre itens. Por exemplo, a matriz de destino de um sistema de recomendação de filmes pode se parecer com a seguinte: os números inteiros positivos são classificações de usuários e 0 significa que o usuário não classificou o filme:

  Casablanca A história da Filadélfia Pantera Negra Mulher-Maravilha Ficção pulp
Usuário 1 5.0 3.0 0,0 2.0 0,0
Usuário 2 4,0 0,0 0,0 1.0 5.0
Usuário 3 3.0 1.0 4,0 5.0 0,0

O sistema de recomendação de filmes tem como objetivo prever classificações de usuários para filmes sem classificação. Por exemplo, o Usuário 1 vai gostar de Pantera Negra?

Uma abordagem para os sistemas de recomendação é usar a fatoração de matrizes para gerar as duas matrizes a seguir:

  • Uma matriz de usuários, formatada como o número de usuários X o número de dimensões de incorporação.
  • Uma matriz de itens, formada pelo número de dimensões de incorporação X do número de itens.

Por exemplo, o uso de fatoração de matriz em nossos três usuários e cinco itens pode gerar a seguinte matriz de usuários e de itens:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

O produto escalar da matriz de usuários e da matriz de itens produz uma matriz de recomendação que contém não apenas as classificações originais de usuários, mas também previsões para os filmes que cada usuário não viu. Por exemplo, considere a avaliação do usuário 1 de Casablanca, que foi 5.0. O produto ponto correspondente a essa célula na matriz de recomendação deve ter aproximadamente 5, 0 e é:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Mais importante, o Usuário 1 vai gostar de Pantera Negra? Pegar o produto escalar correspondente à primeira linha e à terceira coluna gera uma classificação prevista de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Normalmente, a fatoração de matrizes produz uma matriz de usuários e de itens que, em conjunto, são significativamente mais compactas do que a matriz de destino.

Direita

sistema de recomendação

#recsystems

Um sistema que seleciona para cada usuário um conjunto relativamente pequeno de itensdesejáveis de um grande corpus. Por exemplo, um sistema de recomendação de vídeo pode recomendar dois vídeos de um corpus de 100.000, selecionando Casablanca e The Philadelphia Story para um usuário e Wonder Woman e Black Panther para outro. Um sistema de recomendação de vídeo pode basear as recomendações em fatores como:

  • Filmes que usuários semelhantes avaliaram ou assistiram.
  • Gênero, diretores, atores, segmentação demográfica...

reclassificação

#recsystems

A etapa final de um sistema de recomendação, em que os itens pontuados podem ser reavaliados de acordo com algum outro algoritmo (normalmente, não ML). A reclassificação avalia a lista de itens gerados pela fase de pontuação, realizando ações como:

  • Eliminar os itens que o usuário já comprou.
  • Aumentar a pontuação de itens mais recentes.

S

em lote

#recsystems

A parte de um sistema de recomendação que fornece um valor ou classificação para cada item produzido pela fase de geração de candidatos.

U

matriz do usuário

#recsystems

Em sistemas de recomendação, um vetor de embedding gerado pela fatoração de matrizes que contém sinais latentes sobre as preferências do usuário. Cada linha da matriz de usuários contém informações sobre a intensidade relativa de vários sinais latentes para um único usuário. Por exemplo, considere um sistema de recomendação de filmes. Nesse sistema, os sinais latentes na matriz de usuários podem representar o interesse de cada usuário em gêneros específicos ou podem ser mais difíceis de interpretar sinais que envolvem interações complexas em vários fatores.

A matriz do usuário tem uma coluna para cada recurso latente e uma linha para cada usuário. Ou seja, a matriz de usuários tem o mesmo número de linhas que a matriz de destino que está sendo fatorada. Por exemplo, considerando um sistema de recomendação de filmes para 1.000.000 de usuários, a matriz de usuários terá 1.000.000 linhas.

W

Mínimo de quadrados ponderados alternados (WALS)

#recsystems

Um algoritmo para minimizar a função de objetivo durante a fatoração de matrizes em sistemas de recomendação, o que permite uma redução da ponderação dos exemplos ausentes. O WALS minimiza o erro quadrado ponderado entre a matriz original e a reconstrução, alternando entre a correção da fatoração de linha e da fatoração de coluna. Cada uma dessas otimizações pode ser resolvida com a otimização convexa (em inglês) do formato quadrado. Para mais detalhes, consulte o curso de sistemas de recomendação.