Se usó la API de Cloud Translation para traducir esta página.

Marco: Terminología clave de AA

¿Qué es el aprendizaje automático (supervisado)? Dicho de forma concisa, es el siguiente:

Los sistemas de AA aprenden a combinar entradas para producir predicciones útiles sobre datos nunca antes vistos.

Exploremos terminología básica de aprendizaje automático.

Etiquetas

Una etiqueta es el valor que estamos prediciendo: la variable y en la regresión lineal simple. La etiqueta puede ser el precio futuro del trigo, el tipo de animal que se muestra en una imagen, el significado de un clip de audio o casi cualquier cosa.

Funciones

Un atributo es una variable de entrada: la variable x en la regresión lineal simple. Un proyecto de aprendizaje automático simple puede usar una sola característica, mientras que un proyecto de aprendizaje automático más sofisticado podría usar millones de características, especificadas de la siguiente manera:

\[\\{x_1, x_2, ... x_N\\}\]

En el ejemplo del detector de spam, las funciones podrían incluir lo siguiente:

palabras en el texto del correo electrónico
dirección del remitente
Hora del día en que se envió el correo electrónico
correo electrónico contiene la frase "un truco extraño".

Ejemplos

Un ejemplo es una instancia de datos en particular, x. (La x se coloca en negrita para indicar que es un vector). Los ejemplos se dividen en dos categorías:

ejemplos etiquetados
ejemplos sin etiqueta

Un ejemplo etiquetado incluye tanto atributos como la etiqueta. Es decir:

  labeled examples: {features, label}: (x, y)

Usa ejemplos etiquetados para entrenar el modelo. En nuestro ejemplo del detector de spam, los ejemplos etiquetados serían los correos electrónicos individuales que los usuarios marcaron explícitamente como spam o no como spam.

Por ejemplo, la siguiente tabla muestra 5 ejemplos etiquetados de un conjunto de datos que contiene información sobre los precios de la vivienda en California:

ageMedianAge (característica)	totalRooms (función)	totalBedrooms (característica)	medianHouseValue (etiqueta)
15	5612	1283	66900
19	7650	1901	80100
17	720	174	85700
14	1501	337	73400
20	1454	326	65500

Un ejemplo sin etiqueta contiene atributos, pero no la etiqueta. Es decir:

  unlabeled examples: {features, ?}: (x, ?)

Estos son 3 ejemplos sin etiqueta del mismo conjunto de datos de viviendas, que excluyen medianHouseValue:

ageMedianAge (característica)	totalRooms (función)	totalBedrooms (característica)
42	1686	361
34	1226	180
33	1077	271

Una vez que entrenamos nuestro modelo con ejemplos etiquetados, usamos ese modelo para predecir la etiqueta en ejemplos sin etiqueta. En el detector de spam, los ejemplos sin etiqueta son correos electrónicos nuevos que las personas todavía no etiquetaron.

Modelos

Un modelo define la relación entre los atributos y la etiqueta. Por ejemplo, un modelo de detección de spam puede asociar ciertas características con el "spam". Destaquemos dos fases de la vida de un modelo:

Entrenamiento significa crear o aprender el modelo. Es decir, le muestras ejemplos etiquetados al modelo y permites que este aprenda gradualmente las relaciones entre los atributos y la etiqueta.
Inferencia significa aplicar el modelo entrenado a ejemplos sin etiqueta. Es decir, se usa el modelo entrenado para realizar predicciones útiles (y'). Por ejemplo, durante la inferencia, puedes predecir medianHouseValue para ejemplos nuevos sin etiqueta.

Regresión frente a clasificación

Un modelo de regresión predice valores continuos. Por ejemplo, los modelos de regresión realizan predicciones que responden a preguntas como las siguientes:

¿Cuál es el valor de una casa en California?
¿Cuál es la probabilidad de que un usuario haga clic en este anuncio?

Un modelo de clasificación predice valores discretos. Por ejemplo, los modelos de clasificación realizan predicciones que responden a preguntas como las siguientes:

¿Un mensaje de correo electrónico determinado es spam o no es spam?
¿Es la imagen de un perro, un gato o un hámster?

Centro de ayuda

Conferencia de video

Comprueba tu comprensión

modelo de clasificación	ejemplo
función	inferencia
label	model
modelo de regresión	capacitación