Bộ xác thực: Phân vùng khác

Mô-đun trước đã giới thiệu việc phân vùng một tập dữ liệu thành một tập dữ liệu huấn luyện và một tập kiểm thử. Việc phân chia này cho phép bạn huấn luyện trên một tập hợp các ví dụ, sau đó kiểm thử mô hình đó với một tập hợp các ví dụ khác. Với hai phân vùng, quy trình làm việc có thể như sau:

Sơ đồ quy trình làm việc bao gồm ba giai đoạn. 1. Huấn luyện mô hình trên tập hợp huấn luyện. 2. Đánh giá mô hình trên tập hợp kiểm thử. 3. Chỉnh sửa mô hình theo kết quả trên nhóm kiểm thử. Lặp lại các bước 1, 2 và 3, cuối cùng sẽ chọn mô hình hoạt động tốt nhất trên tập kiểm thử.

Hình 1. Có thể có một quy trình công việc nào đó?

Trong hình này, "Tweak mô hình" có nghĩa là điều chỉnh mọi thứ về mô hình mà bạn mong muốn – từ thay đổi tốc độ học, thêm hoặc xoá các tính năng cho đến thiết kế một mô hình hoàn toàn mới từ đầu. Khi kết thúc quy trình công việc này, bạn sẽ chọn mô hình hoạt động tốt nhất trên nhóm kiểm thử.

Bạn nên chia tập dữ liệu thành hai tập dữ liệu, nhưng sẽ không hiệu quả. Bạn có thể giảm đáng kể khả năng tình trạng thừa mức bằng cách phân vùng tập dữ liệu thành ba tập hợp con như trong hình sau:

Một thanh ngang được chia thành ba phần: 70% trong số đó là tập huấn luyện, 15% tập xác thực và 15% tập kiểm thử

Hình 2. Phân tách một tập dữ liệu thành ba tập hợp con.

Sử dụng tập hợp xác thực để đánh giá kết quả từ tập hợp huấn luyện. Sau đó, sử dụng bộ kiểm thử để kiểm tra kỹ phần đánh giá của bạn sau khi mô hình đã "vượt qua" bộ xác thực. Hình sau đây cho thấy quy trình làm việc mới này:

Quy trình làm việc tương tự như Hình 1, ngoại trừ việc thay vì đánh giá mô hình với nhóm kiểm thử, quy trình công việc lại đánh giá mô hình so với nhóm xác thực. Sau đó, khi tập hợp huấn luyện và tập hợp xác thực đồng ý nhiều hơn hoặc ít hơn, hãy xác nhận mô hình này với tập hợp kiểm thử.

Hình 3. Quy trình làm việc hiệu quả hơn.

Trong quy trình làm việc cải tiến này:

  1. Hãy chọn mô hình hoạt động hiệu quả nhất trong tập hợp xác thực.
  2. Kiểm tra kỹ mô hình đó với tập hợp kiểm thử.

Đây là quy trình công việc tốt hơn vì nó tạo ra ít lần hiển thị quảng cáo hơn cho nhóm kiểm thử.