Hãy khám phá các lựa chọn bên dưới.

Hãy xem xét mô hình phân loại chia email thành hai danh mục: "nội dung rác" hoặc "không phải là spam". Nếu bạn tăng ngưỡng phân loại, điều gì sẽ chính xác không?
Chắc chắn là tăng.
Việc tăng ngưỡng phân loại thường làm tăng độ chính xác; tuy nhiên, độ chính xác không được đảm bảo tăng lên đơn điệu khi chúng tôi tăng ngưỡng.
Có thể tăng.
Nhìn chung, việc tăng ngưỡng phân loại làm giảm giá trị false từ đó giúp tăng độ chính xác.
Có thể giảm.
Nhìn chung, việc tăng ngưỡng phân loại làm giảm giá trị false từ đó giúp tăng độ chính xác.
Chắc chắn là giảm.
Nói chung, việc tăng ngưỡng phân loại làm giảm giá trị false từ đó giúp tăng độ chính xác.

Hãy khám phá các lựa chọn bên dưới.

Hãy xem xét mô hình phân loại chia email thành hai danh mục: "nội dung rác" hoặc "không phải là spam". Nếu bạn tăng ngưỡng phân loại, điều gì sẽ nhớ lại?
Luôn tăng.
Việc tăng ngưỡng phân loại sẽ dẫn đến cả hai trường hợp sau:
  • Số lượng kết quả dương tính thật sẽ giảm hoặc giữ nguyên.
  • Số lượng âm tính giả sẽ tăng lên hoặc giữ nguyên.
Do đó, mức độ ghi nhớ quảng cáo sẽ không bao giờ tăng lên.
Luôn giảm hoặc giữ nguyên.
Việc tăng ngưỡng phân loại của chúng tôi sẽ dẫn đến số lượng tỷ lệ dương tính thực giảm xuống hoặc giữ nguyên và sẽ làm cho số lượng âm tính giả tăng lên hoặc giữ nguyên. Do đó, mức độ ghi nhớ sẽ không đổi hoặc giảm xuống.
Luôn giữ cố định.
Việc tăng ngưỡng phân loại của chúng tôi sẽ dẫn đến số lượng tỷ lệ dương tính thực giảm xuống hoặc giữ nguyên và sẽ làm cho số lượng âm tính giả tăng lên hoặc giữ nguyên. Do đó, mức độ ghi nhớ sẽ không đổi hoặc giảm xuống.

Hãy khám phá các lựa chọn bên dưới.

Hãy xem xét hai mô hình A và B, trong đó mỗi mô hình sẽ đánh giá cùng một tập dữ liệu. Câu nào sau đây là đúng?
Nếu Mô hình A có độ chính xác tốt hơn mô hình B thì mô hình A tốt hơn.
Mặc dù độ chính xác càng cao càng tốt, nhưng có thể bạn sẽ gặp phải một số vấn đề về mức độ ghi nhớ giảm đáng kể. Nhìn chung, chúng ta cần xem xét cả độ chính xác lẫn mức độ ghi nhớ hoặc các chỉ số tóm tắt như AUC mà chúng ta sẽ đề cập đến tiếp theo.
Nếu mô hình A có mức độ ghi nhớ tốt hơn mô hình B thì mô hình A là tốt hơn.
Mặc dù mức độ ghi nhớ tốt hơn rất tốt, nhưng có thể nó đến giảm đáng kể độ chính xác. Nhìn chung, chúng tôi cần để xem xét cả độ chính xác và mức độ ghi nhớ, hoặc xem các chỉ số tóm tắt chẳng hạn như AUC, mà chúng ta sẽ đề cập đến trong phần tiếp theo.
Nếu mô hình A có độ chính xác và mức độ ghi nhớ tốt hơn so với mô hình B, thì mô hình A có lẽ tốt hơn.
Nhìn chung, một mô hình hoạt động tốt hơn một mô hình khác ở cả hai thì độ chính xác và mức độ ghi nhớ của quảng cáo có thể là mô hình tốt hơn. Rõ ràng là chúng tôi cần đảm bảo việc so sánh có thể được thực hiện ở độ chính xác / điểm gợi nhớ lại rất hữu ích trong thực tế trở nên có ý nghĩa. Ví dụ: giả sử mô hình phát hiện spam của chúng tôi cần có độ chính xác ít nhất 90% để trở nên hữu ích và tránh báo thức giả không cần thiết. Trong trường hợp này, việc so sánh một mô hình có độ chính xác {20%, thu hồi 99%} sang một mô hình khác ở mức {Độ chính xác 15%, thu hồi 98%} không mang tính hướng dẫn đặc biệt, vì cả hai mô hình đều không đáp ứng yêu cầu về độ chính xác 90%. Tuy nhiên, với cảnh báo đó đây là một cách hay để suy nghĩ về việc so sánh các mô hình khi sử dụng độ chính xác và gợi nhớ.