Системы машинного обучения в реальном мире: прогнозирование рака

На этом уроке вы отладите реальную проблему машинного обучения*, связанную с прогнозированием рака.

Пример из реальной жизни: предсказание рака

  • Модель была обучена предсказывать «вероятность того, что у пациента рак» по медицинским записям.
Раковые клетки
  • Модель была обучена предсказывать «вероятность того, что у пациента рак» по медицинским записям.
  • Характеристики включали возраст пациента, пол, предшествующие заболевания, название больницы, основные показатели жизнедеятельности, результаты анализов.
Раковые клетки
  • Модель была обучена предсказывать «вероятность того, что у пациента рак» по медицинским записям.
  • Характеристики включали возраст пациента, пол, предшествующие заболевания, название больницы, основные показатели жизнедеятельности, результаты анализов.
  • Модель продемонстрировала отличные результаты на задержке тестовых данных.
Раковые клетки
  • Модель была обучена предсказывать «вероятность того, что у пациента рак» по медицинским записям.
  • Характеристики включали возраст пациента, пол, предшествующие заболевания, название больницы, основные показатели жизнедеятельности, результаты анализов.
  • Модель продемонстрировала отличные результаты на задержке тестовых данных.
  • Но модель ужасно работала с новыми пациентами — почему?
Раковые клетки

Как вы думаете, почему модель не смогла хорошо работать с новыми пациентами? Посмотрите, сможете ли вы решить проблему, а затем нажмите кнопку «Воспроизвести» ▶ ниже, чтобы узнать, правы ли вы.

* Мы очень свободно основывали этот модуль (с некоторыми изменениями) на «Утечках в интеллектуальном анализе данных: формулировка, обнаружение и предотвращение» Кауфмана, Россета и Перлиха .