Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Bạn gặp vấn đề gì?
Trước khi bạn xem video hoặc đọc tài liệu, vui lòng hoàn tất
bài tập này khám phá việc lạm dụng các tính năng kết hợp.
Nhiệm vụ 1: Chạy mô hình nguyên trạng với tất cả sản phẩm có trên nhiều sản phẩm cụ thể
các tính năng AI mới. Có điều gì bất ngờ khi mô hình này khớp với dữ liệu không?
Vấn đề là gì?
Nhiệm vụ 2: Thử xoá nhiều tính năng trên nhiều sản phẩm để cải thiện
hiệu suất (mặc dù chỉ một chút). Tại sao việc xóa các tính năng lại
cải thiện hiệu suất?
(Câu trả lời sẽ xuất hiện ngay bên dưới bài tập).
Nhấp vào biểu tượng dấu cộng để xem câu trả lời cho Nhiệm vụ 1.
Đáng ngạc nhiên là ranh giới quyết định của mô hình này có vẻ kỳ lạ. Cụ thể,
có một vùng ở phía trên bên trái gợi ý màu xanh dương, mặc dù
không hỗ trợ rõ ràng về điều đó trong dữ liệu.
Hãy chú ý đến độ dày tương đối của 5 dòng chạy từ INPUT đến OUTPUT.
Các đường này cho biết trọng số tương đối của 5 đối tượng.
Các đường trên X1 và X2 dày hơn nhiều so với
những tính năng bắt nguồn từ tính năng này. Vì vậy, các đặc điểm này
đóng góp ít hơn nhiều cho mô hình so với các tính năng thông thường (không bị chéo).
Nhấp vào biểu tượng dấu cộng để xem câu trả lời cho Nhiệm vụ 2.
Việc xoá tất cả các đặc điểm lai sẽ tạo ra một mô hình hợp lý hơn (có
không còn là đường ranh giới cong gợi ý rằng việc mặc quần áo quá mức)
và làm cho tổng thất bại trong kiểm thử.
Sau 1.000 lần lặp lại, tổn thất kiểm thử phải là giá trị thấp hơn một chút
so với khi tính năng kết hợp diễn ra (mặc dù kết quả của bạn
có thể thay đổi một chút, tuỳ thuộc vào tập dữ liệu).
Dữ liệu trong bài tập này về cơ bản là dữ liệu tuyến tính cộng với độ nhiễu.
Nếu chúng ta sử dụng mô hình quá phức tạp, chẳng hạn như mô hình có quá nhiều
thì chúng ta sẽ tạo cơ hội để điều chỉnh cho phù hợp với nhiễu trong dữ liệu huấn luyện,
thường sẽ khiến mô hình hoạt động kém hiệu quả dựa trên dữ liệu thử nghiệm.
[[["Dễ hiểu","easyToUnderstand","thumb-up"],["Giúp tôi giải quyết được vấn đề","solvedMyProblem","thumb-up"],["Khác","otherUp","thumb-up"]],[["Thiếu thông tin tôi cần","missingTheInformationINeed","thumb-down"],["Quá phức tạp/quá nhiều bước","tooComplicatedTooManySteps","thumb-down"],["Đã lỗi thời","outOfDate","thumb-down"],["Vấn đề về bản dịch","translationIssue","thumb-down"],["Vấn đề về mẫu/mã","samplesCodeIssue","thumb-down"],["Khác","otherDown","thumb-down"]],["Cập nhật lần gần đây nhất: 2024-08-22 UTC."],[],[]]