Hãy khám phá các lựa chọn bên dưới.

Chúng tôi đã xem xét một quy trình sử dụng một bộ kiểm thử và một bộ đào tạo để thúc đẩy lặp lại quá trình phát triển mô hình. Trong mỗi lần lặp lại, chúng tôi sẽ đào tạo dữ liệu đào tạo và đánh giá dựa trên dữ liệu thử nghiệm, sử dụng kết quả đánh giá dựa trên dữ liệu thử nghiệm để định hướng cho các lựa chọn và thay đổi đối với nhiều siêu tham số mô hình như tỷ lệ học tập và các tính năng. Có vấn đề gì với phương pháp này không? (Chỉ chọn một câu trả lời.)
Hoàn toàn bình thường, chúng tôi đang đào tạo về dữ liệu đào tạo và đánh giá trên dữ liệu thử nghiệm riêng biệt, bị chặn.
Thực sự có một vấn đề nhỏ ở đây. Hãy suy nghĩ về những điều có thể xảy ra nếu chúng ta lặp đi lặp lại nhiều lần biểu mẫu này.
Nếu thực hiện nhiều vòng trong quy trình này, chúng ta có thể sẽ hoàn toàn phù hợp với đặc điểm của nhóm thử nghiệm cụ thể.
Đúng vậy! Chúng tôi càng đánh giá thường xuyên trên một nhóm thử nghiệm nhất định, chúng tôi càng có nguy cơ gặp phải tình trạng trùng lặp hoàn toàn với một nhóm thử nghiệm đó. Chúng ta sẽ tìm hiểu về một giao thức tốt hơn ở bước tiếp theo.
Phương thức này không hiệu quả về mặt tính toán. Chúng ta chỉ cần chọn một bộ siêu tham số mặc định và trực tiếp với các tham số đó để tiết kiệm tài nguyên.
Mặc dù những loại hình lặp lại này gây tốn kém nhưng đây là một phần quan trọng trong quá trình phát triển mô hình. Các chế độ cài đặt siêu tham số có thể tạo ra sự khác biệt lớn về chất lượng của mô hình. Do đó, chúng ta phải luôn dành một lượng thời gian và tài nguyên có thể tính toán để đảm bảo có được chất lượng tốt nhất có thể.