Equidad: Tipos de sesgo

Los modelos de aprendizaje automático no son intrínsecamente objetivos. Los ingenieros alimentan los modelos mediante un conjunto de datos de ejemplos de entrenamiento, y la participación humana en el aprovisionamiento y la selección de estos datos puede hacer que las predicciones de un modelo sean susceptibles al sesgo.

Cuando creas modelos, es importante tener en cuenta los sesgos cognitivos humanos que pueden manifestarse en los datos, de modo que puedas tomar medidas proactivas para mitigar sus efectos.

Sesgo de reporte

El sesgo de informe se produce cuando la frecuencia de los eventos, las propiedades o los resultados capturados en un conjunto de datos no refleja con exactitud su frecuencia en el mundo real. Este sesgo puede surgir porque las personas tienden a enfocarse en documentar circunstancias que son inusuales o especialmente memorables, suponiendo que lo común puede ir sin decirlo.

Sesgo de automatización

El sesgo de automatización es la tendencia a favorecer los resultados que se generan mediante sistemas automatizados en lugar de aquellos generados por sistemas no automatizados, sin importar las tasas de error de cada uno.

Sesgo de selección

El sesgo de selección se produce si los ejemplos de un conjunto de datos se eligen de un modo que no refleja su distribución en el mundo real. El sesgo de selección puede tomar muchas formas diferentes:

  • Sesgo de cobertura: Los datos no se seleccionan de manera representativa.
  • Sesgo de no respuesta (o sesgo de participación): Los datos no resultan representativos debido a brechas de participación en el proceso de recopilación de datos.
  • Sesgo muestral: No se utiliza la selección aleatoria adecuada durante la recopilación de datos.

Sesgo de correspondencia

El sesgo de correspondencia es una tendencia a generalizar la realidad de las personas de un grupo entero al que pertenecen. Dos manifestaciones clave de este sesgo son las siguientes:

  • Sesgo endogrupal: Preferencia para los miembros de un grupo al que también perteneces o por características que también compartes.
  • Sesgo de homogeneidad de los demás: Se trata de una tendencia a estereotipar a los miembros individuales de un grupo al que no perteneces o creer que sus características son más uniformes.

Sesgo implícito

El sesgo implícito se produce cuando se realizan suposiciones en función de modelos mentales propios y experiencias personales que no se aplican necesariamente a un nivel más general.

Una forma común de sesgo implícito es el sesgo de confirmación: los creadores de modelos procesan inconscientemente los datos de formas que afirman sus hipótesis y creencias preexistentes. En algunos casos, un creador de modelos en realidad puede seguir entrenando un modelo hasta que produce un resultado que se alinea con su hipótesis original. Esto se denomina sesgo de investigación.