โมเดลป่าการตัดสินใจประกอบด้วยต้นไม้ตัดสินใจ อัลกอริทึมการเรียนรู้ของการกําหนดการตัดสินใจ (เช่น ป่าแบบสุ่ม) ต้องอาศัยการเรียนรู้ของการตัดสินใจเป็นหลัก
ในส่วนนี้ของหลักสูตร คุณจะได้ศึกษาชุดข้อมูลตัวอย่างขนาดเล็กและเรียนรู้ วิธีการฝึกโครงสร้างการตัดสินใจแบบเดี่ยว ในส่วนถัดไป คุณจะได้เรียนรู้วิธีการรวมต้นไม้แห่งการตัดสินใจเพื่อฝึกการตัดสินใจ
# https://www.tensorflow.org/decision_forests/api_docs/python/tfdf/keras/CartModel model = tfdf.keras.CartModel(...)
รูปแบบ
ต้นไม้ตัดสินใจคือโมเดลที่ประกอบด้วยคอลเล็กชัน "question" ลําดับชั้นของรูปทรงของต้นไม้ คําถามมักจะเรียกว่าเงื่อนไข การแยก หรือการทดสอบ เราจะใช้คําว่า "condition" ในชั้นเรียนนี้ แต่ละโหนดที่ไม่ใช่ Leaf จะมีเงื่อนไข และโหนด Leaf แต่ละรายการจะมีการคาดการณ์
โดยทั่วไปแล้ว พฤกษชาติจะปลูกรากด้วยใบไม้ที่ด้านล่าง แต่โดยปกติแล้วต้นไม้ที่ตัดสินใจเลือกแล้วจะปรากฏโดยมีราก (โหนดแรก) ที่ด้านบน
รูปที่ 1 แผนผังการตัดสินใจเรื่องการจัดประเภทแบบง่าย คําอธิบายในสีเขียวไม่ใช่ส่วนหนึ่งของแผนผังการตัดสินใจ
การอนุมานของโมเดลแผนผังการตัดสินใจจะคํานวณโดยการกําหนดเส้นทางตัวอย่างจากราก (ที่ด้านบน) ไปยังโหนดของใบไม้ (ที่ด้านล่าง) ตามเงื่อนไข มูลค่าของใบไม้ที่ไปถึงคือการคาดการณ์ต้นไม้สําหรับการตัดสินใจ เราจะเรียกชุดของโหนดที่เข้าชมว่าเส้นทางการอนุมาน เช่น ลองพิจารณาค่าฟีเจอร์ต่อไปนี้
จํานวนขา | จํานวนดวงตา |
---|---|
4 | 2 |
การคาดคะเนจะเป็น dog เส้นทางการอนุมานจะเป็น
- num_legs ≥ 3 → ใช่
- num_eyes ≥ 3 → ไม่
รูปที่ 2 เส้นทางการอนุมานที่สะสมในใบไม้ *สุนัข* ในตัวอย่าง *{num_legs : 4, num_eyes : 2}*
ในตัวอย่างก่อนหน้านี้ ใบของต้นไม้การตัดสินใจจะมีการคาดคะเนการแยกประเภท กล่าวคือ ใบไม้แต่ละใบจะมีสัตว์สายพันธุ์ต่างๆ อยู่ในชุดสายพันธุ์ที่เป็นไปได้
ในทํานองเดียวกัน แผนผังการตัดสินใจจะคาดการณ์ค่าตัวเลขได้โดยการติดป้ายกํากับใบไม้ด้วยการคาดคะเนการถดถอย (ค่าตัวเลข) เช่น แผนผังการตัดสินใจต่อไปนี้คาดการณ์คะแนนความน่ารักเป็นตัวเลขของสัตว์ที่อยู่ระหว่าง 0 ถึง 10
รูปที่ 3 แผนผังการตัดสินใจที่ทําให้เกิดตัวเลขการคาดการณ์