Marco: Comprueba tu comprensión

Aprendizaje supervisado

Explora las opciones que aparecen a continuación.

Imagina que quieres desarrollar un modelo de aprendizaje automático supervisado para predecir si un determinado correo electrónico "es spam" o "no es spam". ¿Cuáles de las siguientes afirmaciones son verdaderas?
Los correos electrónicos no marcados como "es spam" o "no es spam" son ejemplos sin etiqueta.
Dado que nuestra etiqueta consiste en los valores "es spam" y "no es spam", cualquier correo electrónico que todavía no se haya marcado como "es spam" o "no es spam" es un ejemplo sin etiqueta.
Las palabras del encabezado de asunto serán buenas etiquetas.
Las palabras del encabezado de asunto podrían generar atributos excelentes, pero no serán buenas etiquetas.
Se usarán ejemplos sin etiqueta para entrenar el modelo.
Se usarán ejemplos etiquetados para entrenar el modelo. De este modo, el modelo entrenado se puede ejecutar con ejemplos sin etiqueta para inferir si los mensajes de correo electrónico sin etiqueta son spam o no son spam.
Algunas etiquetas pueden ser poco confiables.
Indudablemente. Es probable que las etiquetas de este conjunto de datos provengan de usuarios de correo electrónico que marcan determinados mensajes como spam. Dado que muy pocos usuarios marcan cada mensaje de correo electrónico sospechoso como spam, es posible que resulte muy difícil saber concretamente si un correo electrónico es spam. Además, algunos generadores de spam o botnets podrían contaminar intencionalmente nuestro modelo al proporcionar etiquetas con fallas.

Atributos y etiquetas

Explora las opciones que aparecen a continuación.

Imagina que una tienda de calzado en línea quiere crear un modelo de AA supervisado que proporcione a los usuarios recomendaciones personalizadas sobre zapatos. Esto significa que el modelo recomendará determinados pares de zapatos a Martín y otros pares de zapatos a Juana. ¿Cuáles de las siguientes afirmaciones son verdaderas?
La talla del calzado es un atributo útil.
La talla del calzado es un indicador cuantificable que probablemente tenga un fuerte impacto en el hecho de que al usuario le gusten los zapatos recomendados. Por ejemplo, si Martín calza 9, el modelo no debe recomendar zapatos de talla 7.
La belleza del calzado es un atributo útil.
Los buenos atributos son concretos y cuantificables. La belleza es un concepto demasiado impreciso como para representar un atributo útil. La belleza probablemente sea una combinación de determinados atributos concretos, como estilo y color. El estilo y el color serían mejores atributos que la belleza.
Los clics del usuario en la descripción de un zapato son una etiqueta útil.
Es probable que los usuarios solo quieran leer más acerca de los zapatos que les gustan. Por lo tanto, los clics del usuario son una métrica observable y cuantificable que podría funcionar como una buena etiqueta de entrenamiento.
Los zapatos que le fascinan a un usuario son una etiqueta útil.
La fascinación no es una métrica observable ni cuantificable. Lo mejor que podemos hacer es buscar métricas cuantificables que aproximen lo mejor posible la fascinación.

Enviar comentarios sobre…

Curso intensivo de aprendizaje automático