Перегляньте варіанти нижче.

Припустімо, що онлайн-магазин взуття хоче створити керовану модель машинного навчання, яка надаватиме користувачам персоналізовані рекомендації щодо взуття. Тобто модель рекомендуватиме Андрію одне взуття, а Світлані – інше. Система використовуватиме дані про минулу поведінку користувачів, щоб згенерувати навчальні дані. Які з тверджень, наведених нижче, правильні?
"Розмір взуття" – корисна ознака.
"Розмір взуття" – це кількісно вимірюваний сигнал, який, імовірно, сильно впливає на те, чи сподобається користувачеві рекомендована пара. Наприклад, якщо Андрій носить розмір 9, модель не має рекомендувати взуття розміру 7.
"Краса взуття" – корисна ознака.
Гарні ознаки конкретні, і їх можна кількісно виміряти. Краса – надто розпливчасте поняття, щоб бути корисною ознакою. Імовірно, це поєднання якихось конкретних ознак, наприклад стилю й кольору, І вони будуть ліпшими ознаками, ніж краса.
"Користувач натиснув на опис взуття" – корисна мітка.
Імовірно, користувачі хочуть прочитати більше лише про те взуття, яке їм подобається. Тому кліки користувачів є спостережуваною, кількісно вимірюваною метрикою, яка може бути хорошою навчальною міткою. Оскільки основа навчальних даних – минула поведінка користувачів, мітки мають ґрунтуватися на об’єктивній поведінці (зокрема на кліках, які тісно пов’язані з уподобаннями).
"Взуття, яке користувач обожнює" – корисна мітка.
Обожнювання не можна спостерігати й виміряти кількісно. Потрібно шукати метрики, наближені до "обожнювання", які можна спостерігати.