Hãy khám phá các lựa chọn bên dưới.
Hãy xem xét mô hình phân loại chia email thành hai danh mục:
"nội dung rác" hoặc "không phải là spam". Nếu bạn tăng ngưỡng phân loại, điều gì sẽ
chính xác không?
Chắc chắn là tăng.
Việc tăng ngưỡng phân loại thường làm tăng độ chính xác;
tuy nhiên, độ chính xác không được đảm bảo tăng lên đơn điệu
khi chúng tôi tăng ngưỡng.
Có thể tăng.
Nhìn chung, việc tăng ngưỡng phân loại làm giảm giá trị false
từ đó giúp tăng độ chính xác.
Có thể giảm.
Nhìn chung, việc tăng ngưỡng phân loại làm giảm giá trị false
từ đó giúp tăng độ chính xác.
Chắc chắn là giảm.
Nói chung, việc tăng ngưỡng phân loại làm giảm giá trị false
từ đó giúp tăng độ chính xác.
Hãy khám phá các lựa chọn bên dưới.
Hãy xem xét mô hình phân loại chia email thành hai danh mục:
"nội dung rác" hoặc "không phải là spam". Nếu bạn tăng ngưỡng phân loại, điều gì sẽ
nhớ lại?
Luôn tăng.
Việc tăng ngưỡng phân loại sẽ dẫn đến cả hai trường hợp sau:
- Số lượng kết quả dương tính thật sẽ giảm hoặc giữ nguyên.
- Số lượng âm tính giả sẽ tăng lên hoặc giữ nguyên.
Luôn giảm hoặc giữ nguyên.
Việc tăng ngưỡng phân loại của chúng tôi sẽ dẫn đến số lượng
tỷ lệ dương tính thực giảm xuống hoặc giữ nguyên và sẽ làm cho
số lượng âm tính giả tăng lên hoặc giữ nguyên. Do đó,
mức độ ghi nhớ sẽ không đổi hoặc giảm xuống.
Luôn giữ cố định.
Việc tăng ngưỡng phân loại của chúng tôi sẽ dẫn đến số lượng
tỷ lệ dương tính thực giảm xuống hoặc giữ nguyên và sẽ làm cho
số lượng âm tính giả tăng lên hoặc giữ nguyên. Do đó,
mức độ ghi nhớ sẽ không đổi hoặc giảm xuống.
Hãy khám phá các lựa chọn bên dưới.
Hãy xem xét hai mô hình A và B, trong đó mỗi mô hình sẽ đánh giá cùng một tập dữ liệu.
Câu nào sau đây là đúng?
Nếu Mô hình A có độ chính xác tốt hơn mô hình B thì
mô hình A tốt hơn.
Mặc dù độ chính xác càng cao càng tốt, nhưng có thể bạn sẽ gặp phải một số vấn đề
về mức độ ghi nhớ giảm đáng kể. Nhìn chung, chúng ta cần xem xét
cả độ chính xác lẫn mức độ ghi nhớ hoặc các chỉ số tóm tắt như AUC
mà chúng ta sẽ đề cập đến
tiếp theo.
Nếu mô hình A có mức độ ghi nhớ tốt hơn mô hình B thì mô hình A là
tốt hơn.
Mặc dù mức độ ghi nhớ tốt hơn rất tốt, nhưng có thể nó đến
giảm đáng kể độ chính xác. Nhìn chung, chúng tôi cần
để xem xét cả độ chính xác và mức độ ghi nhớ, hoặc xem các chỉ số tóm tắt
chẳng hạn như AUC, mà chúng ta sẽ đề cập đến trong phần tiếp theo.
Nếu mô hình A có độ chính xác và mức độ ghi nhớ tốt hơn so với mô hình B,
thì mô hình A có lẽ tốt hơn.
Nhìn chung, một mô hình hoạt động tốt hơn một mô hình khác ở cả hai
thì độ chính xác và mức độ ghi nhớ của quảng cáo có thể
là mô hình tốt hơn. Rõ ràng là
chúng tôi cần đảm bảo việc so sánh có thể được thực hiện ở
độ chính xác / điểm gợi nhớ lại rất hữu ích trong thực tế
trở nên có ý nghĩa. Ví dụ: giả sử mô hình phát hiện spam của chúng tôi
cần có độ chính xác ít nhất 90% để trở nên hữu ích và tránh
báo thức giả không cần thiết. Trong trường hợp này, việc so sánh
một mô hình có độ chính xác {20%, thu hồi 99%} sang một mô hình khác ở mức
{Độ chính xác 15%, thu hồi 98%} không mang tính hướng dẫn đặc biệt, vì
cả hai mô hình đều không đáp ứng yêu cầu về độ chính xác 90%. Tuy nhiên, với cảnh báo đó
đây là một cách hay để suy nghĩ về việc so sánh các mô hình khi sử dụng
độ chính xác và gợi nhớ.