Sistemas de aprendizaje automático en el mundo real: Predicción del cáncer

En esta lección, depurarás un problema de aprendizaje automático en el mundo real* relacionado con la predicción del cáncer.

Ejemplo del mundo real: Predicción del cáncer

  • El modelo se entrenó para predecir la "probabilidad de que el paciente tenga cáncer" a partir de los registros médicos.
Células cancerígenas
  • El modelo se entrenó para predecir la "probabilidad de que el paciente tenga cáncer" a partir de los registros médicos.
  • Los atributos incluyeron el nombre del hospital y la edad, el sexo, las enfermedades anteriores, los signos vitales y los resultados de las pruebas del paciente.
Células cancerígenas
  • El modelo se entrenó para predecir la "probabilidad de que el paciente tenga cáncer" a partir de los registros médicos.
  • Los atributos incluyeron el nombre del hospital y la edad, el sexo, las enfermedades anteriores, los signos vitales y los resultados de las pruebas del paciente.
  • El modelo tuvo un rendimiento excelente en los datos de prueba considerados.
Células cancerígenas
  • El modelo se entrenó para predecir la "probabilidad de que el paciente tenga cáncer" a partir de los registros médicos.
  • Los atributos incluyeron el nombre del hospital y la edad, el sexo, las enfermedades anteriores, los signos vitales y los resultados de las pruebas del paciente.
  • El modelo tuvo un rendimiento excelente en los datos de prueba considerados.
  • Sin embargo, el modelo tuvo un rendimiento muy deficiente en los pacientes nuevos. ¿Por qué?
Células cancerígenas

¿Por qué crees que el modelo no funcionó correctamente con pacientes nuevos? Intenta resolver el problema y, luego, haz clic en el botón Reproducir ▶ que aparece a continuación para ver si acertaste.

* Este módulo se basó en líneas muy generales (con algunas modificaciones sobre la marcha) en "Leakage in data mining: formulation, detection, and avoidance" de Kaufman, Rosset y Perlich.