Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Como mencionado no
Regressão linear
módulo, calcular
viés de previsão
é uma verificação rápida que pode sinalizar problemas com o modelo ou os dados de treinamento
desde o início.
O viés de previsão é a diferença entre a média
previsões
e a média de
Rótulos de informações empíricas na
dados. um modelo treinado em um conjunto de dados
em que 5% dos e-mails são spam deve prever, em média, que 5% das
e-mails que ele classifica como spam. Em outras palavras, a média dos rótulos na
conjunto de dados de informações empíricas é 0,05, e a média das previsões do modelo deve
também será 0,05. Nesse caso, o modelo não tem viés de previsão.
é claro, o modelo ainda pode ter outros problemas.
Se o modelo prevê que 50% das vezes que um e-mail é spam, então
algo deu errado com o conjunto de dados de treinamento, o novo conjunto de dados que o modelo
aplicada ou com o próprio modelo. Qualquer um
uma diferença significativa entre os dois significa que o modelo tem
algum viés de previsão.
O viés de previsão pode ser causado por:
Vieses ou ruído nos dados, incluindo amostragem tendenciosa para o conjunto de treinamento.
regularização muito forte, ou seja, o modelo foi simplificado demais e perdido
alguma complexidade necessária
Bugs no pipeline de treinamento de modelo
O conjunto de atributos fornecidos ao modelo sendo insuficiente para a tarefa
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Não contém as informações de que eu preciso","missingTheInformationINeed","thumb-down"],["Muito complicado / etapas demais","tooComplicatedTooManySteps","thumb-down"],["Desatualizado","outOfDate","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Problema com as amostras / o código","samplesCodeIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2024-08-13 UTC."],[[["Prediction bias, calculated as the difference between the average prediction and the average ground truth, is a quick check for model or data issues."],["A model with zero prediction bias ideally predicts the same average outcome as observed in the ground truth data, such as a spam detection model predicting the same percentage of spam emails as actually present in the dataset."],["Significant prediction bias can indicate problems in the training data, the model itself, or the new data being applied to the model."],["Common causes of prediction bias include biased data, excessive regularization, bugs in the training process, and insufficient features provided to the model."]]],[]]