يتم إنشاء تقاطعات السمات من خلال تقاطع (أخذ المنتج الديكارتي) سمتَين أو أكثر من السمات الفئوية أو المقسّمة في مجموعة البيانات. مثل عمليات تحويل المتعدّدة الحدود، تسمح تقاطعات السمات للنماذج الخطية بمعالجة الوظائف غير الخطية. تُشفِّر تقاطعات العناصر أيضًا التفاعلات بين العناصر.
على سبيل المثال، نأخذ مجموعة بيانات ورقة تحتوي على الميزات الفئوية التالية:
edges
، التي تحتوي على القيمsmooth
وtoothed
وlobed
arrangement
التي تحتوي على القيمتَينopposite
وalternate
لنفترض أنّ الترتيب أعلاه هو ترتيب أعمدة السمات في تمثيل واحد ساخن
، بحيث يتم تمثيل ورقة ذات smooth
حواف وopposite
ترتيب
على أنّها {(1, 0, 0), (1, 0)}
.
سيكون تقاطع الميزات أو المنتج الديكارتي لهذه الميزتَين على النحو التالي:
{Smooth_Opposite, Smooth_Alternate, Toothed_Opposite, Toothed_Alternate,
Lobed_Opposite, Lobed_Alternate}
حيث تكون قيمة كل مصطلح هي حاصل ضرب قيم السمات الأساسية، على النحو التالي:
Smooth_Opposite = edges[0] * arrangement[0]
Smooth_Alternate = edges[0] * arrangement[1]
Toothed_Opposite = edges[1] * arrangement[0]
Toothed_Alternate = edges[1] * arrangement[1]
Lobed_Opposite = edges[2] * arrangement[0]
Lobed_Alternate = edges[2] * arrangement[1]
على سبيل المثال، إذا كانت الورقة تحتوي على حافة lobed
وترتيب alternate
، سيكون لسمة
التقاطع مع السمة قيمة 1 لسمة Lobed_Alternate
وقيمة
0 لجميع السمات الأخرى:
{0, 0, 0, 0, 0, 1}
يمكن استخدام مجموعة البيانات هذه لتصنيف الأوراق حسب أنواع الأشجار، لأنّ هذه السمات لا تختلف ضمن نوع معيّن.
حالات استخدام تقاطعات العناصر
يمكن أن تقترح المعرفة بالموضوع مجموعة مفيدة من الميزات التي يمكن عبورها. بدون هذه المعرفة المتعلّقة بالنطاق، قد يكون من الصعب تحديد عمليات تقاطع العناصر الفعّالة أو عمليات التحويل المتعددة الحدود يدويًا. غالبًا ما يكون من الممكن استخدام الشبكات العصبية لمحاولة بشكل تلقائي العثور على مجموعات مفيدة من الميزات وتطبيقها أثناء التدريب، إلا أنّ ذلك قد يكون مكلفًا من الناحية الحسابية.
يُرجى الانتباه إلى أنّ تقاطع سمتَين متفرقتَين ينتج عنه سمة جديدة أكثر تفرّقًا من السمتَين الأصليتَين. على سبيل المثال، إذا كانت الميزة "أ" هي ميزة متفرّقة تتألف من 100 عنصر وكانت الميزة "ب" هي ميزة متفرّقة تتألف من 200 عنصر، يؤدي تقاطع الميزة "أ" مع الميزة "ب" إلى إنشاء ميزة متفرّقة تتألف من 20,000 عنصر.