การจัดประเภท: ความถูกต้อง

ความแม่นยําเป็นเมตริกหนึ่งในการประเมินโมเดลการแยกประเภท อย่างไม่เป็นทางการ ความถูกต้องแม่นยําเป็นเศษส่วนของการคาดการณ์ที่โมเดลของเราทําให้ถูกต้อง ความแม่นยําถูกต้อง มีดังต่อไปนี้

$$\text{Accuracy} = \frac{\text{Number of correct predictions}}{\text{Total number of predictions}}$$

สําหรับการแยกประเภทไบนารี ระบบจะคํานวณความแม่นยําทั้งในด้านบวกและด้านลบได้ดังนี้

$$\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN}$$

โดยที่ TP = ผลบวกจริง, TN = ค่าลบจริง, FP = ผลบวกลวง และ FN = ผลลบลวง

มาลองคํานวณความแม่นยําสําหรับโมเดลต่อไปนี้ซึ่งจัดเป็น 100 เนื้องอกเป็นร้ายแรง (คลาสเชิงบวก) หรือไม่ร้ายแรง (คลาสเชิงลบ) ดังนี้

True Positive (TP):
  • เรียลลิตี้: มุ่งร้าย
  • โมเดล ML ที่คาดการณ์: ร้ายแรง
  • จํานวนผลลัพธ์ TP: 1
False Positive (FP):
  • เรียลลิตี้: ไม่เป็นอันตราย
  • โมเดล ML ที่คาดการณ์: ร้ายแรง
  • จํานวนผลลัพธ์ FP: 1
FalseFalse (FN):
  • เรียลลิตี้: มุ่งร้าย
  • โมเดล ML ที่คาดการณ์: ไม่เป็นอันตราย
  • จํานวนผลลัพธ์ FN: 8
True true (TN)
  • เรียลลิตี้: ไม่เป็นอันตราย
  • โมเดล ML ที่คาดการณ์: ไม่เป็นอันตราย
  • จํานวนผลลัพธ์ TN: 90
$$\text{Accuracy} = \frac{TP+TN}{TP+TN+FP+FN} = \frac{1+90}{1+90+1+8} = 0.91$$

ความแม่นยําที่ได้คือ 0.91 หรือ 91% (การคาดการณ์ที่ถูกต้อง 91 รายการจากทั้งหมด 100 รายการ) นั่นหมายความว่าตัวแยกประเภทเนื้องอกของเราทํางานได้ดี ในการระบุตัวร้ายใช่ไหม

ที่จริง เรามาวิเคราะห์เชิงบวกและเชิงลบกันอย่างละเอียดมากขึ้นเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับประสิทธิภาพของโมเดลของเรามากขึ้น

จากตัวอย่างเนื้องอก 100 ตัวอย่าง 91 ไม่เป็นอันตราย (90 TN และ 1 FPS) และ 9 เป็นภัย (1 TP และ 8 FN)

จากเนื้องอกที่ไม่เป็นอันตราย 91 รายการ โมเดลระบุว่า 90 นั้นไม่เป็นอันตราย เยี่ยมเลย อย่างไรก็ตาม จากเนื้องอกที่เป็นอันตราย 9 รายการ รูปแบบจะระบุเพียง 1 ว่าเป็น "อันตราย" เท่านั้น ซึ่งเป็นผลลัพธ์ที่ยอดเยี่ยม เนื่องจากเนื้อร้าย 8 จาก 9 รายการมีรูปแบบไม่ถูกต้อง

แม้ว่าความแม่นยํา 91% อาจดูดีเมื่อมองผ่านครั้งแรก แต่โมเดลตัวแยกประเภทเนื้ออีกตัวที่คาดการณ์ความไม่เป็นอันตรายนั้น มักจะมีความแม่นยําเท่ากัน (การคาดการณ์ที่ถูกต้อง 91/100) ในตัวอย่างของเรา กล่าวอีกนัยหนึ่งคือ โมเดลของเราไม่ได้ดีไปกว่าแบบเชิงคาดการณ์ ที่สามารถแยกเนื้องอกร้ายออกจากเนื้องอกที่ไม่เป็นอันตรายได้

ความแม่นยําเพียงอย่างเดียวไม่ได้บอกเรื่องราวทั้งหมดเมื่อคุณทํางานด้วยชุดข้อมูลที่ไม่สมดุลเช่นนี้ ซึ่งมีความต่างระหว่างจํานวนป้ายกํากับเชิงบวกกับป้ายกํากับเชิงลบ

ในส่วนถัดไป เราจะดูเมตริก 2 อย่างที่ดีกว่านี้ สําหรับการประเมินปัญหาที่ไม่สมดุลกัน ได้แก่ ความแม่นยําและการจดจํา