Ponga a prueba sus conocimientos

Las siguientes preguntas te ayudan a consolidar tu comprensión de los conceptos básicos del AA.

Poder predictivo

Los modelos de AA supervisados se entrenan con conjuntos de datos con ejemplos etiquetados. El modelo aprende a predecir la etiqueta a partir de los atributos. Sin embargo, no todos los atributos en un conjunto de datos tienen poder predictivo. En algunos casos, solo algunos atributos actúan como predictores de la etiqueta. En el conjunto de datos a continuación, usa el precio como la etiqueta y las columnas restantes como los atributos.

Ejemplo etiquetado de atributos de automóviles

¿Cuáles cree que son las tres características que más probablemente predicen el precio de un automóvil?
Make_model, año, millas.
Es probable que la marca o el modelo de un automóvil, el año y las millas se encuentren entre los factores predictivos más sólidos de su precio.
Color, height, make_model.
La altura y el color de un automóvil no sirven para predecir su precio.
Millas, caja de cambios, make_model.
La caja de cambios no es el principal predictor del precio.
Tamaño del neumático, distancia_rueda, año
El tamaño del neumático y la base de la rueda no sirven para predecir el precio de un automóvil.

Aprendizaje supervisado y no supervisado

Según el problema, usarás un enfoque supervisado o no supervisado. Por ejemplo, si sabes de antemano el valor o la categoría que deseas predecir, deberías usar aprendizaje supervisado. Sin embargo, si quieres saber si tu conjunto de datos contiene segmentaciones o agrupaciones de ejemplos relacionados, usarías el aprendizaje no supervisado.

Supongamos que tienes un conjunto de datos de usuarios para un sitio web de compras en línea y contiene las siguientes columnas:

Imagen de una fila de atributos de clientes.

Si quisieras comprender los tipos de usuarios que visitan el sitio, ¿usarías el aprendizaje supervisado o no supervisado?
Aprendizaje no supervisado.
Como queremos que el modelo agrupe grupos de clientes relacionados, nos usaríamos el aprendizaje no supervisado. Después de que el modelo agrupaba a los usuarios, teníamos que crear nuestros propios nombres para cada clúster, por ejemplo, “buscadores de descuentos”, “cazadores de ofertas”, “surfistas”, “leales” y “viajeros”.
Aprendizaje supervisado, porque intento predecir a qué clase pertenece un usuario
En el aprendizaje supervisado, el conjunto de datos debe contener la etiqueta que intentas predecir. En el conjunto de datos, no hay ninguna etiqueta que haga referencia a una categoría de usuario.

Supongamos que tienes un conjunto de datos sobre el uso de energía de las casas con las siguientes columnas:

Imagen de una fila de atributos de la casa.

¿Qué tipo de AA usarías para predecir los kilovatios-hora que se usan por año en una casa recién construida?
Aprendizaje supervisado.
El aprendizaje supervisado se entrena sobre ejemplos etiquetados. En este conjunto de datos, la etiqueta sería “kilowatt horas por año”, ya que este es el valor que quieres que prediga el modelo. Los atributos serían “metros cuadrados”, “ubicación” y “año de construcción”.
Aprendizaje no supervisado.
El aprendizaje no supervisado usa ejemplos sin etiqueta. En este ejemplo, “kilovatios-horas usadas por año” sería la etiqueta porque este es el valor que quieres que prediga el modelo.

Supongamos que tienes un conjunto de datos sobre vuelos con las siguientes columnas:

Imagen de una fila de datos de vuelos.

Si quisieras predecir el costo de un boleto de autobús, ¿usarías la regresión o la clasificación?
Regresión
El resultado de un modelo de regresión es un valor numérico.
Clasificación
El resultado de un modelo de clasificación es un valor discreto, por lo general, una palabra. En este caso, el costo de un boleto de autobús es un valor numérico.
Según el conjunto de datos, ¿podrías entrenar un modelo de clasificación para clasificar el costo de un boleto de autobús como “alto”, “promedio” o “bajo”?
Sí, pero primero debemos convertir los valores numéricos de la columna coach_ticket_cost en valores categóricos.
Es posible crear un modelo de clasificación a partir del conjunto de datos. Deberías hacer algo como lo siguiente:
  1. Consulta el costo promedio de un boleto desde el aeropuerto de salida al aeropuerto de destino.
  2. Determina los umbrales que constituirían “alto”, “promedio” y “bajo”.
  3. Compara el costo previsto con los umbrales y obtén el resultado de la categoría en la que se encuentra el valor.
No. No es posible crear un modelo de clasificación. Los valores coach_ticket_cost son numéricos, no categóricos.
Con un poco de trabajo, podría crear un modelo de clasificación.
No. Los modelos de clasificación solo predicen dos categorías, como spam o not_spam. Este modelo tendría que predecir tres categorías.
Los modelos de clasificación pueden predecir varias categorías. Se llaman modelos de clasificación multiclase.

Capacitación y evaluación

Después de entrenar un modelo, lo evaluamos mediante un conjunto de datos con ejemplos etiquetados y comparamos el valor predicho del modelo con el valor real de la etiqueta.

Selecciona las dos mejores respuestas para la pregunta.

Si las predicciones del modelo son lejanas, ¿qué podrías hacer para mejorarlas?
Vuelve a entrenar el modelo, pero usa solo los atributos que consideres que tienen el mayor poder predictivo para la etiqueta.
Volver a entrenar el modelo con menos atributos, pero que tienen más poder predictivo, puede producir un modelo que realice mejores predicciones.
No puedes arreglar un modelo cuyas predicciones estén muy alejadas.
Es posible arreglar un modelo cuyas predicciones están desactivadas. La mayoría de los modelos requieren varias rondas de entrenamiento hasta que realizan predicciones útiles.
Vuelve a entrenar el modelo con un conjunto de datos más grande y diverso.
Los modelos entrenados con conjuntos de datos con más ejemplos y un rango de valores más amplio pueden producir mejores predicciones, ya que el modelo tiene una solución mejor generalizada para la relación entre los atributos y la etiqueta.
Prueba un enfoque de entrenamiento diferente. Por ejemplo, si utilizaste un enfoque supervisado, prueba uno no supervisado.
Un enfoque de entrenamiento diferente no produciría mejores predicciones.

Ya está listo para dar el siguiente paso en su recorrido por el AA:

  • People + AI Guidebook Si buscas un conjunto de métodos, prácticas recomendadas y ejemplos presentados por Googlers y expertos de la industria, así como investigaciones académicas sobre el uso del AA

  • Enmarcado de problemas. Si buscas un enfoque de prueba de campo para crear modelos de AA y evitar dificultades comunes durante el proceso.

  • Curso intensivo de aprendizaje automático. Si estás listo para un enfoque profundo y práctico a fin de aprender más sobre el AA.