Équité : types de biais

Les modèles de machine learning ne sont pas objectifs par nature. Les ingénieurs entraînent des modèles en leur fournissant un ensemble de données composé d'exemples d'apprentissage. L'implication humaine dans la fourniture et l'organisation de ces données peut introduire un biais dans les prédictions du modèle.

Lorsque vous créez des modèles, il est important de connaître les biais humains les plus courants qui peuvent se manifester dans vos données afin d'en atténuer les effets en prenant des mesures proactives.

Biais de fréquence

Le biais de fréquence survient lorsque la fréquence des événements, des propriétés et/ou des résultats collectés dans un ensemble de données ne correspond pas exactement à leur fréquence réelle. Ce biais peut être dû au fait que les personnes ont tendance à consigner en priorité les circonstances inhabituelles ou particulièrement mémorables, estimant inutile de signaler celles qui sont ordinaires.

Biais d'automatisation

Le biais d'automatisation désigne la propension à privilégier les résultats générés par des systèmes automatisés aux dépens de ceux générés par des systèmes non automatisés, indépendamment du taux d'erreur de chacun.

Biais de sélection

Le biais de sélection survient lorsque la façon dont les exemples d'un ensemble de données sont choisis ne correspond pas à leur distribution réelle. Le biais de sélection peut prendre de nombreuses formes :

  • Biais de couverture : les données ne sont pas sélectionnées de manière représentative.
  • Biais de non-réponse (ou biais de participation) : les données finissent par ne pas être représentatives en raison d'écarts de participation lors de leur collecte.
  • Biais d'échantillonnage : la collecte de données ne fait pas l'objet d'une sélection véritablement aléatoire.

Biais de représentativité

Le biais de représentativité désigne la propension à généraliser ce qui est vrai pour certains individus à l'ensemble d'un groupe auquel ils appartiennent. Les deux principales manifestations de ce biais sont les suivantes :

  • Biais d'appartenance : préférence pour les membres d'un groupe auquel vous appartenez également ou pour des caractéristiques qui sont également les vôtres.
  • Biais d'homogénéité de l'exogroupe : propension à stéréotyper les individus membres d'un groupe auquel vous n'appartenez pas ou à considérer leurs caractéristiques comme plus uniformes.

Biais implicite

Le biais implicite survient lorsque l'on formule des hypothèses fondées sur notre expérience personnelle et nos propres modèles mentaux, lesquels ne sont pas nécessairement généralisables.

Une forme courante de biais implicite est le biais de confirmation, qui survient lorsque les concepteurs de modèles traitent inconsciemment les données de manière à confirmer des croyances et des hypothèses préexistantes. Dans certains cas, le concepteur peut même continuer à entraîner un modèle jusqu'à ce qu'il obtienne un résultat conforme à son hypothèse d'origine. C'est ce que l'on appelle l'effet expérimentateur.