Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Như đã đề cập trong
Hồi quy tuyến tính
mô-đun, tính toán
thiên vị dự đoán
là một tuỳ chọn kiểm tra nhanh có thể gắn cờ các vấn đề với mô hình hoặc dữ liệu huấn luyện
từ sớm.
Độ lệch dự đoán là độ chênh lệch giữa giá trị trung bình của một mô hình
cụm từ gợi ý
và giá trị trung bình của
nhãn ground-thực-thật trong
. Một mô hình được huấn luyện trên một tập dữ liệu
trong đó 5% email là thư rác nên dự đoán trung bình rằng 5%
email mà hệ thống phân loại là thư rác. Nói cách khác, giá trị trung bình của các nhãn trong
là 0, 05 và giá trị trung bình của các dự đoán trong mô hình
cũng là 0,05. Nếu trường hợp này xảy ra, mô hình có độ lệch dự đoán bằng 0. Trong tổng số
tất nhiên mô hình đó vẫn có thể gặp phải các vấn đề khác.
Thay vào đó, nếu mô hình này dự đoán 50% thời gian email là thư rác, thì
đã xảy ra lỗi với tập dữ liệu huấn luyện, tập dữ liệu mới mà mô hình là
được áp dụng hoặc với chính mô hình. Bất kỳ hạng nào
sự khác biệt đáng kể giữa hai giá trị trung bình cho thấy mô hình này
một số thiên kiến dự đoán.
Nguyên nhân có thể là do:
Độ lệch hoặc nhiễu trong dữ liệu, bao gồm cả độ sai lệch lấy mẫu cho tập huấn luyện
Quy chuẩn hoá quá mạnh, tức là mô hình bị đơn giản hoá quá mức và bị mất
một số độ phức tạp cần thiết
Lỗi trong quy trình huấn luyện mô hình
Tập hợp tính năng được cung cấp cho mô hình không đủ cho nhiệm vụ
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2024-08-13 UTC."],[[["Prediction bias, calculated as the difference between the average prediction and the average ground truth, is a quick check for model or data issues."],["A model with zero prediction bias ideally predicts the same average outcome as observed in the ground truth data, such as a spam detection model predicting the same percentage of spam emails as actually present in the dataset."],["Significant prediction bias can indicate problems in the training data, the model itself, or the new data being applied to the model."],["Common causes of prediction bias include biased data, excessive regularization, bugs in the training process, and insufficient features provided to the model."]]],[]]