机器学习系统在现实世界中的应用:癌症预测

在本课程中,您将调试与癌症预测相关的现实机器学习问题*。

真实示例:癌症预测

  • 训练模型根据病历来预测“患者患有癌症的概率”
癌细胞
  • 训练模型根据病历来预测“患者患有癌症的概率”
  • 功能包括患者年龄、性别、过往疾病、医院名称、生命体征、检测结果
癌细胞
  • 训练模型根据病历来预测“患者患有癌症的概率”
  • 功能包括患者年龄、性别、过往疾病、医院名称、生命体征、检测结果
  • 模型在留出的测试数据方面表现出色
癌细胞
  • 训练模型根据病历来预测“患者患有癌症的概率”
  • 功能包括患者年龄、性别、过往疾病、医院名称、生命体征、检测结果
  • 模型在留出的测试数据方面表现出色
  • 但模型对新病人的表现却很糟糕 - 为什么?
癌细胞

为什么您认为此模型无法很好地应用于新患者?看看您能不能找出问题所在,然后点击下面的“播放”按钮 ▶,看看您的判断是否正确。

* 我们根据 Kaufman、Rosset 和 Perlich 的《数据挖掘泄漏:成型、检测和规避》()大致介绍了该模块(在此过程中进行了一些修改)。