Bộ xác thực

Việc phân vùng tập dữ liệu thành một tập dữ liệu huấn luyện và tập kiểm thử cho phép bạn đánh giá xem một mô hình nhất định có khái quát hoá tốt cho dữ liệu mới hay không. Tuy nhiên, việc chỉ sử dụng 2 phân vùng có thể là không đủ khi thực hiện nhiều vòng điều chỉnh siêu tham số.

Xác nhận kết quả

Sơ đồ quy trình làm việc bao gồm ba giai đoạn. 1. Huấn luyện mô hình trên tập hợp huấn luyện. 2. Đánh giá mô hình trên tập hợp kiểm thử. 3. Chỉnh sửa mô hình theo kết quả trên nhóm kiểm thử. Lặp lại các bước 1, 2 và 3, cuối cùng sẽ chọn mô hình hoạt động tốt nhất trên tập kiểm thử.
Một thanh ngang được chia thành ba phần: 70% trong số đó là tập huấn luyện, 15% tập xác thực và 15% tập kiểm thử
Quy trình làm việc tương tự như Hình 1, ngoại trừ việc thay vì đánh giá mô hình với nhóm kiểm thử, quy trình công việc lại đánh giá mô hình so với nhóm xác thực. Sau đó, khi tập hợp huấn luyện và tập hợp xác thực đồng ý nhiều hơn hoặc ít hơn, hãy xác nhận mô hình này với tập hợp kiểm thử.