ต้นไม้แห่งการตัดสินใจ

โมเดลป่าการตัดสินใจประกอบด้วยต้นไม้ตัดสินใจ อัลกอริทึมการเรียนรู้ของการกําหนดการตัดสินใจ (เช่น ป่าแบบสุ่ม) ต้องอาศัยการเรียนรู้ของการตัดสินใจเป็นหลัก

ในส่วนนี้ของหลักสูตร คุณจะได้ศึกษาชุดข้อมูลตัวอย่างขนาดเล็กและเรียนรู้ วิธีการฝึกโครงสร้างการตัดสินใจแบบเดี่ยว ในส่วนถัดไป คุณจะได้เรียนรู้วิธีการรวมต้นไม้แห่งการตัดสินใจเพื่อฝึกการตัดสินใจ

ใน TF-DF ให้ใช้อัลกอริทึม CART เพื่อฝึกโมเดลต้นไม้การตัดสินใจ
# https://www.tensorflow.org/decision_forests/api_docs/python/tfdf/keras/CartModel
model = tfdf.keras.CartModel(...)

รูปแบบ

ต้นไม้ตัดสินใจคือโมเดลที่ประกอบด้วยคอลเล็กชัน "question" ลําดับชั้นของรูปทรงของต้นไม้ คําถามมักจะเรียกว่าเงื่อนไข การแยก หรือการทดสอบ เราจะใช้คําว่า "condition" ในชั้นเรียนนี้ แต่ละโหนดที่ไม่ใช่ Leaf จะมีเงื่อนไข และโหนด Leaf แต่ละรายการจะมีการคาดการณ์

โดยทั่วไปแล้ว พฤกษชาติจะปลูกรากด้วยใบไม้ที่ด้านล่าง แต่โดยปกติแล้วต้นไม้ที่ตัดสินใจเลือกแล้วจะปรากฏโดยมีราก (โหนดแรก) ที่ด้านบน

แผนผังการตัดสินใจที่ประกอบด้วย 2 เงื่อนไขและ 3 ใบ เงื่อนไขแรก (ราก) คือ num_legs >= 3 เงื่อนไขที่ 2 คือ num_eyes >= 3 ใบ 3 ใบคือเพนกวิน แมงมุม และสุนัข

รูปที่ 1 แผนผังการตัดสินใจเรื่องการจัดประเภทแบบง่าย คําอธิบายในสีเขียวไม่ใช่ส่วนหนึ่งของแผนผังการตัดสินใจ

 

การอนุมานของโมเดลแผนผังการตัดสินใจจะคํานวณโดยการกําหนดเส้นทางตัวอย่างจากราก (ที่ด้านบน) ไปยังโหนดของใบไม้ (ที่ด้านล่าง) ตามเงื่อนไข มูลค่าของใบไม้ที่ไปถึงคือการคาดการณ์ต้นไม้สําหรับการตัดสินใจ เราจะเรียกชุดของโหนดที่เข้าชมว่าเส้นทางการอนุมาน เช่น ลองพิจารณาค่าฟีเจอร์ต่อไปนี้

จํานวนขา จํานวนดวงตา
4 2

การคาดคะเนจะเป็น dog เส้นทางการอนุมานจะเป็น

  1. num_legs ≥ 3 → ใช่
  2. num_eyes ≥ 3 → ไม่

ภาพประกอบเดียวกันกับรูปที่ 1 แต่ภาพประกอบนี้แสดงเส้นทางการอนุมานจาก 2 เงื่อนไขที่สิ้นสุดในใบไม้สําหรับสุนัข

รูปที่ 2 เส้นทางการอนุมานที่สะสมในใบไม้ *สุนัข* ในตัวอย่าง *{num_legs : 4, num_eyes : 2}*

 

ในตัวอย่างก่อนหน้านี้ ใบของต้นไม้การตัดสินใจจะมีการคาดคะเนการแยกประเภท กล่าวคือ ใบไม้แต่ละใบจะมีสัตว์สายพันธุ์ต่างๆ อยู่ในชุดสายพันธุ์ที่เป็นไปได้

ในทํานองเดียวกัน แผนผังการตัดสินใจจะคาดการณ์ค่าตัวเลขได้โดยการติดป้ายกํากับใบไม้ด้วยการคาดคะเนการถดถอย (ค่าตัวเลข) เช่น แผนผังการตัดสินใจต่อไปนี้คาดการณ์คะแนนความน่ารักเป็นตัวเลขของสัตว์ที่อยู่ระหว่าง 0 ถึง 10

แผนผังการตัดสินใจซึ่งแต่ละใบจะมีจํานวนจุดลอยตัวที่ต่างกัน

รูปที่ 3 แผนผังการตัดสินใจที่ทําให้เกิดตัวเลขการคาดการณ์