Datos categóricos: Combinaciones de atributos

Las combinaciones de atributos se crean combinando (tomando el producto cartesiano) dos o más atributos categóricos o agrupados del conjunto de datos. Al igual que las transformaciones de polinomios, las combinaciones de atributos permiten que los modelos lineales manejen las no linealidades. Las combinaciones de atributos también codifican las interacciones entre los atributos.

Por ejemplo, considera un conjunto de datos de hoja con los atributos categóricos:

  • edges, que contiene los valores smooth, toothed y lobed
  • arrangement, que contiene los valores opposite y alternate

Supongamos que el orden anterior es el orden de las columnas de atributos en una representación one-hot, de modo que una hoja con smooth bordes y una disposición opposite se representa como {(1, 0, 0), (1, 0)}.

La combinación de atributos, o producto cartesiano, de estos dos atributos sería la siguiente:

{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate, Lobed_Opposite, Lobed_Alternate}

en el que el valor de cada término es el producto de los valores de los atributos base, de modo que:

  • Smooth_Opposite = edges[0] * arrangement[0]
  • Smooth_Alternate = edges[0] * arrangement[1]
  • Toothed_Opposite = edges[1] * arrangement[0]
  • Toothed_Alternate = edges[1] * arrangement[1]
  • Lobed_Opposite = edges[2] * arrangement[0]
  • Lobed_Alternate = edges[2] * arrangement[1]

Por ejemplo, si una hoja tiene un borde lobed y una disposición alternate, el vector de combinación de características tendrá un valor de 1 para Lobed_Alternate y un valor de 0 para todos los demás términos:

{0, 0, 0, 0, 0, 1}

Este conjunto de datos se podría usar para clasificar las hojas por especie de árbol, ya que estas características no varían dentro de una especie.

Cuándo usar cruces de atributos

El conocimiento del dominio puede sugerir una combinación útil de atributos para cruzar. Sin ese conocimiento del dominio, puede ser difícil determinar manualmente las combinaciones de atributos o las transformaciones polinómicas eficaces. A menudo, es posible, si es costoso en términos de procesamiento, usar redes neuronales para encontrar y aplicar automáticamente combinaciones de características útiles durante el entrenamiento.

Ten cuidado: cruzar dos atributos dispersos produce un atributo nuevo aún más disperso que los dos originales. Por ejemplo, si el atributo A es un atributo disperso de 100 elementos y el atributo B es un atributo disperso de 200 elementos, una combinación de atributos de A y B genera un atributo disperso de 20,000 elementos.