Los modelos de aprendizaje automático (AA) no son objetivos de manera inherente. Profesionales del AA a entrenar modelos a través de un conjunto de datos con ejemplos de entrenamiento la participación en el aprovisionamiento y la selección de estos datos puede hacer que la calidad predicciones susceptibles de sesgo.
Cuando se crean modelos, es importante tener en cuenta los sesgos humanos comunes se manifiestan en tus datos, de modo que puedas tomar medidas proactivas para mitigar sus efectos.
Sesgo de reporte
-
Definición
El sesgo de reporte ocurre cuando la frecuencia de eventos, propiedades o resultados capturados en un conjunto de datos no que reflejen con precisión su frecuencia en el mundo real. Este sesgo puede surgir porque las personas tienden a enfocarse en documentar circunstancias inusual o especialmente memorable, asumiendo que lo común no que se deben grabar.
-
Ejemplo
Se entrena un modelo de análisis de opiniones para predecir si los libros las opiniones son positivas o negativas según un corpus de usuarios los envíos a un sitio web popular. La mayoría de las opiniones en la conjunto de datos de entrenamiento reflejan opiniones extremas (revisores que amaron o odiaron un libro), porque era menos probable que las personas enviaran una opinión sobre un libro si no respondió a él con firmeza. Como resultado, el modelo es menos capaz de predecir correctamente la opinión de reseñas que usan un lenguaje más sutil para describir un libro.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo histórico
-
Definición
El sesgo histórico ocurre cuando los datos históricos refleja las desigualdades que existían en el mundo en ese momento.
-
Ejemplo
Un conjunto de datos de viviendas de una ciudad de la década de 1960 contiene datos sobre precios de viviendas que refleja prácticas de préstamos discriminatorias vigentes durante esa década.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de automatización
-
Definición
El sesgo de automatización es la tendencia a favorecer los resultados generadas por sistemas automatizados sobre las generadas de sistemas, sin importar la tasa de error de cada uno.
-
Ejemplo
Los profesionales del AA que trabajaban para un fabricante de piñones estaban ansiosos por implementar el nuevo enfoque que entrenaron para identificar defectos dentales, hasta que el supervisor de la fábrica le indicara que el las tasas de precisión y recuperación del modelo fueron un 15% más bajas que las de inspectores humanos.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de selección
El sesgo de selección ocurre cuando los ejemplos del conjunto de datos se eligen de una manera que no refleje su distribución del mundo real. El sesgo de selección puede adoptar muchas formas diferentes, incluidos el sesgo de cobertura, el sesgo de no respuesta y el sesgo del muestreo.
Sesgo de cobertura
-
Definición
El sesgo de cobertura tiene lugar si los datos no se seleccionan en de manera representativa.
-
Ejemplo
Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto. Consumidores que, en cambio, optaron por comprar un producto de la competencia no fueron encuestados y, como resultado, este grupo de personas no fue representados en los datos de entrenamiento.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de no respuesta
-
Definición
Sesgo de no respuesta (también conocido como sesgo de participación) ocurre si los datos terminan siendo no representativos debido a brechas de participación en la recopilación de datos el proceso de administración de recursos.
-
Ejemplo
Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto y con una muestra de consumidores que compraron un producto producto. Los consumidores que compraron el producto de la competencia obtuvieron un 80% más se negaran a completar la encuesta, y sus datos fueron subrepresentados en la muestra.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo muestral
-
Definición
El sesgo del muestreo ocurre si se permite una aleatorización adecuada no se utilizan durante la recopilación de datos.
-
Ejemplo
Se entrena un modelo para predecir las ventas futuras de un producto nuevo basado en en encuestas telefónicas realizadas a una muestra de consumidores que realizaron compras el producto y con una muestra de consumidores que compraron un producto producto. En lugar de orientarse a los consumidores al azar, el encuestador eligió a los primeros 200 consumidores que respondieron un correo electrónico, quienes podrían Se mostraron más entusiasmados con el producto que el promedio compradores.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de correspondencia
Sesgo de correspondencia es la tendencia a generalizar la verdad sobre los individuos para todo el grupo a las que pertenecen. El sesgo de correspondencia a menudo se manifiesta formularios.
Sesgo endogrupal
-
Definición
El sesgo endogrupal es una preferencia para los miembros de en tu propio grupo al que también perteneces o por características que tú también compartes.
-
Ejemplo
Dos profesionales del AA entrenan un modelo para filtrar currículums de los desarrolladores de software están predispuestos a creer que los solicitantes que asistieron a la misma academia de informática que ellos están más calificados para el puesto.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de homogeneidad de los demás
-
Definición
El sesgo de homogeneidad de los demás es la tendencia estereotipar a los miembros individuales de un grupo al que tú pertenecen o ven sus características como más uniformes.
-
Ejemplo
Dos profesionales del AA entrenan un modelo para filtrar currículums de los desarrolladores de software están predispuestos a creer que todos los solicitantes que no asistieron a una academia de informática experiencia suficiente para el puesto.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo implícito
-
Definición
El sesgo implícito tiene lugar cuando se realizan suposiciones. basada en el modelo propio de pensamiento y experiencias personales que no se aplican necesariamente a un nivel más general.
-
Ejemplo
Un profesional de AA que entrena un modelo de reconocimiento de gestos usa un movimiento de cabeza como una función para indicar que una persona está comunicando la palabra "no". Sin embargo, en algunas regiones del mundo, un movimiento de la cabeza significa "sí".
Haz clic en . PERCENTAGE_left para la definición.
Sesgo de confirmación
-
Definición
El sesgo de confirmación ocurre cuando los creadores de modelos procesar inconscientemente los datos de formas que reafirman creencias preexistentes e hipótesis.
-
Ejemplo
Un profesional del AA está creando un modelo que predice la agresividad en perros según sus características (altura, peso, raza, entorno). El practicante tuvo un encuentro desagradable con un caniche toy hiperactivo cuando era niño y, desde entonces, se ha asociado raza con agresión. Cuando selecciones los datos de entrenamiento del modelo, el profesional descartó inconscientemente las características que proporcionaban evidencia de docilidad en perros más pequeños.
Haz clic en . PERCENTAGE_left para la definición.
Sesgo del investigador
-
Definición
El sesgo de investigador ocurre cuando se crea un modelo sigue entrenando un modelo hasta que produce un resultado que se alinea con su hipótesis original.
-
Ejemplo
Un profesional del AA está creando un modelo que predice la agresividad en perros según sus características (altura, peso, raza, entorno). El practicante tuvo un encuentro desagradable con un caniche toy hiperactivo cuando era niño y, desde entonces, se ha asociado raza con agresión. Cuándo el modelo entrenado predijo más los caniches toy sean relativamente dóciles, el practicante volvió a entrenarlo varias veces más hasta que arroje un resultado que muestre caniches más pequeños a ser más violentos.
Haz clic en . PERCENTAGE_left para la definición.