Equidad: Tipos de sesgo

Los modelos de aprendizaje automático no son objetivos por sí solos. Para entrenarlos, los ingenieros los alimentan con un conjunto de datos de ejemplos de entrenamiento, y la participación humana en el aprovisionamiento y la selección de estos datos puede hacer que las predicciones del modelo sean susceptibles al sesgo.

A la hora de construir modelos, es importante ser consciente de los sesgos humanos comunes que pueden manifestarse en los datos, de manera que puedas tomar medidas proactivas para mitigar sus efectos.

Sesgo de reporte

El sesgo de reporte se produce cuando la frecuencia de los eventos, propiedades o resultados contenidos en un conjunto de datos no refleja con exactitud su frecuencia en el mundo real. Una posible causa es que las personas tienden a enfocarse en el registro de circunstancias inusuales o especialmente memorables, ya que se asume que lo común se encuentra implícito.

Sesgo de automatización

El sesgo de automatización es la tendencia a favorecer los resultados que se generan mediante sistemas automatizados sobre los que se generan a través de aquellos que no lo son, sin importar la tasa de error de cada uno.

Sesgo de selección

El sesgo de selección tiene lugar cuando los ejemplos de un conjunto de datos se eligen de un modo que no refleja su distribución en el mundo real. Existen diferentes formas de sesgo de selección:

  • Sesgo de cobertura: No se seleccionan los datos de manera representativa.
  • Sesgo de no respuesta (o sesgo de participación): Los datos no resultan representativos debido a falta de participación en el proceso de recopilación de datos.
  • Sesgo muestral: No se utiliza la selección aleatoria adecuada durante la recopilación de datos.

Sesgo de correspondencia

El sesgo de correspondencia es una tendencia a generalizar la realidad de los individuos de un grupo entero al que pertenecen. Estas son las dos manifestaciones principales de este tipo de sesgo:

  • Sesgo endogrupal: Se manifiesta una preferencia por los miembros de un grupo al que también perteneces o por características que también compartes.
  • Sesgo de homogeneidad de los demás: Se trata de una tendencia a estereotipar a los miembros individuales de un grupo al que no perteneces o creer que sus características son más uniformes.

Sesgo implícito

El sesgo implícito tiene lugar cuando se realizan suposiciones en función de modelos mentales propios y experiencias personales que no aplican necesariamente a un nivel más general.

Una forma común de sesgo implícito es el sesgo de confirmación: quienes crean modelos procesan inconscientemente los datos de formas que afirman sus hipótesis y creencias preexistentes. En algunos casos, quien crea el modelo continúa entrenándolo hasta que produce un resultado que concuerda con su hipótesis original. Esto se denomina sesgo de investigación.

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático