Koşul türleri

Bu birim, karar ağaçlarını oluşturmak için kullanılan farklı conditions türlerine odaklanır.

Eksene hizalı ve eğik koşullar

Eksene hizalanmış koşul yalnızca tek bir özellik içerir. Eğik koşul birden fazla özellik içerir. Örneğin, aşağıdaki durum eksene hizalı bir koşuldur:

num_legs ≥ 2

Aşağıdaki de eğik bir koşuldur:

num_legs ≥ num_fingers

Karar ağaçları genellikle yalnızca eksene hizalanan koşullarla eğitilir. Ancak, eğik bölmeler daha karmaşık kalıplar ifade edebildikleri için daha güçlüdür. Eğik bölmeler bazen daha yüksek eğitim ve çıkarım maliyetlerine karşılık daha iyi sonuçlar üretir.

YDF Kodu
YDF'de karar ağaçları varsayılan olarak eksene hizalı koşulla eğitilir. Karar eğik ağaçları split_axis="SPARSE_OBLIQUE" parametresiyle etkinleştirebilirsiniz.

Eksene hizalı koşul "num_legs >= 3"tür. Eğik koşul "num_legs + ağırlık * 5 >= 12" şeklindedir.

Şekil 4. Eksene hizalı ve eğik koşul örnekleri.

 

Önceki iki koşulun grafiği çizildiğinde aşağıdaki özellik alanı ayrımı elde edilir:

Kilo ile bacak_sayısı karşılaştırması grafiği. Eksene hizalı koşul, ağırlığı göz ardı etmez ve bu nedenle yalnızca dikey bir çizgidir. Eğik koşulunda negatif eğimli bir çizgi görülüyor.

Şekil 5. Şekil 4'teki koşullar için boşluk ayırma özelliğini kullanın.

 

İkili koşullar ve ikili olmayan koşullar

İki olası sonucu olan durumlara (örneğin, doğru veya yanlış) ikili koşullar denir. Yalnızca ikili koşullar içeren karar ağaçlarına ikili karar ağaçları denir.

İkili olmayan koşullar'da ikiden fazla olası sonuç vardır. Bu nedenle, ikili olmayan koşullar ikili koşullardan daha fazla ayrımcı güce sahiptir. Bir veya daha fazla ikili olmayan koşul içeren kararlara ikili olmayan karar ağaçları adı verilir.

İkili ve ikili olmayan karar ağaçlarının karşılaştırması. İkili karar ağacı iki ikili koşul içerir; "binary" olmayan karar ağacı ise "binary" olmayan bir koşul içerir.

Şekil 6: İkili ve ikili olmayan karar ağaçları karşılaştırması.

 

Çok fazla güce sahip olan koşulların aşması daha olasıdır. Bu nedenle, karar ormanlarında genellikle ikili karar ağaçları kullanıldığından bu kursta bu ağaçlara odaklanacağız.

En yaygın koşul türü, aşağıdaki şekilde ifade edilen eşik koşuludur:

featurethreshold

Örneğin:

num_legs ≥ 2

Başka koşul türleri de mevcuttur. Yaygın olarak kullanılan diğer ikili koşul türleri aşağıda verilmiştir:

 

Tablo 2. Yaygın ikili koşul türleri.

Ad Koşul Örnek
eşik koşulu $\mathrm{feature}_i \geq \mathrm{eşik}$ $\mathrm{num\_legs} \geq 2$
eşitlik koşulu $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
belirlenen koşul $\mathrm{feature}_i \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
eğik durum $\sum_{i} \mathrm{ağırlık}_i \mathrm{özellik}_i \geq \mathrm{eşik}$ 5 TL \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
özellik eksik $\mathrm{özellik}_i \mathrm{is} \mathrm{Eksik}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$