หน้านี้ได้รับการแปลโดย Cloud Translation API

การถดถอยแบบโลจิสติกส์: การคํานวณความน่าจะเป็น

หลายปัญหาจําเป็นต้องใช้ค่าประมาณความน่าจะเป็นเป็นเอาต์พุต การถดถอยแบบโลจิสติกส์เป็นกลไกที่มีประสิทธิภาพมากในการคํานวณความน่าจะเป็น ในทางปฏิบัติ คุณสามารถใช้ความน่าจะเป็นของการคืนสินค้าด้วยวิธีใดวิธีหนึ่งใน 2 วิธีนี้

"ตามที่มีอยู่&;
แปลงเป็นหมวดหมู่ไบนารีแล้ว

มาพิจารณาวิธีที่เราใช้ความน่าจะเป็นกัน"ตามที่มีอยู่" สมมติว่าเราสร้างรูปแบบการถดถอยแบบโลจิสติกส์เพื่อคาดการณ์แนวโน้มที่สุนัขจะเห่ากลางดึก เราจะเรียกความน่าจะเป็นนี้ว่า

\[p(bark | night)\]

หากโมเดลการถดถอยแบบโลจิสติกส์คาดการณ์ไว้ $p(bark | night) = 0.05$ กว่า 1 ปี เจ้าของสุนัขควรจะต้องตื่นขึ้นมาประมาณ 18 ครั้ง

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

ในหลายกรณี คุณจะจับคู่เอาต์พุตของการถดถอยแบบโลจิสติกส์กับวิธีการแก้ปัญหาการแยกประเภทแบบไบนารี ซึ่งมีเป้าหมายเพื่อคาดการณ์ป้ายกํากับที่เป็นไปได้จาก 1 ใน 2 รายการต่อไปนี้ได้อย่างถูกต้อง (เช่น "spam" หรือ "ไม่ใช่สแปม") โดยโมดูลในภายหลังจะโฟกัสในส่วนนี้

คุณอาจสงสัยว่ารูปแบบการถดถอยแบบโลจิสติกส์ช่วยให้เอาต์พุตเป็นไปตาม 0 ถึง 1 เสมอได้อย่างไร เมื่อเกิดกรณีนี้ขึ้น ฟังก์ชัน sigmoid ที่ระบุไว้จะสร้างเอาต์พุตที่มีลักษณะเดียวกันต่อไปนี้

$$y = \frac{1}{1 + e^{-z}}$$

ฟังก์ชัน sigmoid จะสร้างพล็อตต่อไปนี้

ฟังก์ชัน Sigmoid แกน x คือค่าอนุมานดิบ แกน Y ขยายจาก 0 ถึง +1 ไม่รวม

รูปที่ 1: ฟังก์ชัน Sigmoid

หาก $z$ แสดงถึงเอาต์พุตของเลเยอร์เชิงเส้นของโมเดลที่ฝึกด้วยการถดถอยแบบโลจิสติก $sigmoid(z)$ จะทําให้ค่า (ความน่าจะเป็น) ระหว่าง 0 ถึง 1 ในเชิงคณิตศาสตร์ ให้ทําดังนี้

$$y' = \frac{1}{1 + e^{-z}}$$

ที่ไหน:

$y'$ เป็นเอาต์พุตของโมเดลการถดถอยแบบโลจิสติกส์สําหรับตัวอย่างที่เจาะจง
$z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N$
- ค่า $w$ คือค่าน้ําหนักโดยประมาณของโมเดล และ $b$ คือการให้น้ําหนักพิเศษ
- ค่า $x$ คือค่าฟีเจอร์สําหรับตัวอย่างที่เฉพาะเจาะจง

โปรดทราบว่า $z$ เรียกอีกอย่างว่า od-od เนื่องจากผกผันของ sigmoid ที่ระบุ $z$ ได้เป็นบันทึกของความน่าจะเป็นของป้ายกํากับ $1$ (เช่น "สุนัขเห่า") หารด้วยความน่าจะเป็นของ $0$ ป้ายกํากับ (เช่น "สุนัขไม่'เห่า"):

$$ z = \log\left(\frac{y}{1-y}\right) $$

ฟังก์ชัน sigmoid ที่มีป้ายกํากับ ML มีดังนี้