Hãy khám phá các lựa chọn bên dưới.

Giả sử một cửa hàng giày trực tuyến muốn tạo một mô hình máy học được giám sát để cung cấp các đề xuất giày tùy chỉnh cho người dùng. Như vậy, mô hình sẽ đề xuất một số đôi giày cho Marty và nhiều loại giày cho Janet. Hệ thống sẽ sử dụng dữ liệu hành vi của người dùng trước đây để tạo dữ liệu huấn luyện. Câu nào sau đây là đúng?
"Shoe size" là một tính năng hữu ích.
"Shoe size" là một tín hiệu có thể định lượng và có thể tác động mạnh mẽ đến việc liệu người dùng có thích đôi giày được đề xuất hay không. Ví dụ: Nếu Marty đi cỡ 9, thì người mẫu này không nên chọn giày cỡ 7.
"Shoe Beauty" là một tính năng hữu ích.
Các tính năng tốt sẽ cụ thể và có thể đo lường được. Làm đẹp là một khái niệm quá mơ hồ để phục vụ như một tính năng hữu ích. Làm đẹp có thể là sự kết hợp một số đặc điểm cụ thể, chẳng hạn như phong cách và màu sắc. Phong cách và màu sắc sẽ là những tính năng tốt hơn so với việc làm đẹp.
"Người dùng nhấp vào nội dung mô tả giày" là một nhãn hữu ích.
Người dùng có thể chỉ muốn đọc thêm về những đôi giày họ thích. Do đó, số lượt nhấp của người dùng là một chỉ số có thể quan sát được và có thể định lượng, có thể đóng vai trò là một nhãn đào tạo hiệu quả. Vì dữ liệu huấn luyện của chúng tôi bắt nguồn từ hành vi của người dùng trước đây, nên nhãn của chúng tôi cần xuất phát từ các hành vi khách quan như các lượt nhấp có liên quan chặt chẽ đến lựa chọn ưu tiên của người dùng.
"Giày mà người dùng yêu thích" là một nhãn hữu ích.
Adors không phải là một chỉ số có thể quan sát và có thể định lượng. Cách tốt nhất chúng ta có thể làm là tìm kiếm các chỉ số proxy có thể quan sát được.