Hồi quy logistic: Tính xác suất

Nhiều bài toán yêu cầu ước tính xác suất dưới dạng kết quả. Hồi quy logistic là một cơ chế cực kỳ hiệu quả để tính xác suất. Trên thực tế, bạn có thể sử dụng xác suất được trả về theo một trong hai cách sau:

  • "As nguyên"
  • Đã chuyển đổi thành danh mục nhị phân.

Hãy cân nhắc cách chúng ta có thể sử dụng xác suất " nguyên trạng; Giả sử chúng ta tạo một mô hình hồi quy logistic để dự đoán xác suất một con chó sẽ sủa vào giữa đêm. Chúng ta sẽ gọi xác suất đó là:

\[p(bark | night)\]

Nếu mô hình hồi quy logistic dự đoán \(p(bark | night) = 0.05\), thì trong hơn một năm, chủ sở hữu những chú chó này sẽ bị tỉnh giấc khoảng 18 lần:

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

Trong nhiều trường hợp, bạn sẽ liên kết đầu ra hồi quy logistic vào giải pháp này cho vấn đề phân loại nhị phân, trong đó mục tiêu là dự đoán chính xác một trong hai nhãn có thể có (ví dụ: "spam" hoặc "không phải spam". Một mô-đun sau này tập trung vào điều đó.

Bạn có thể tự hỏi làm thế nào một mô hình hồi quy logistic có thể đảm bảo đầu ra luôn nằm trong khoảng từ 0 đến 1. Khi xảy ra, hàm sigmoid (được định nghĩa như sau) sẽ tạo ra kết quả đầu ra có các đặc điểm tương tự:

$$y = \frac{1}{1 + e^{-z}}$$

Hàm sigmoid tạo ra biểu đồ sau:

Hàm Sigmoid. Trục x là giá trị dự đoán thô. Trục y mở rộng từ 0 đến +1.

Hình 1: Hàm Sigmoid.

Nếu \(z\) đại diện cho kết quả của lớp tuyến tính của một mô hình được huấn luyện bằng phép hồi quy logistic, thì \(sigmoid(z)\) sẽ cho ra một giá trị (xác suất) trong khoảng từ 0 đến 1. Về mặt toán học:

$$y' = \frac{1}{1 + e^{-z}}$$

nơi:

  • \(y'\) là kết quả của mô hình hồi quy logistic cho một ví dụ cụ thể.
  • \(z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\)
    • Các giá trị \(w\) là trọng số đã học của mô hình và \(b\) là các đối tượng chung sở thích.
    • Giá trị \(x\) là các giá trị tính năng cho một ví dụ cụ thể.

Lưu ý rằng \(z\) còn được gọi là các nhật ký nhật ký vì nghịch đảo của sigmoid cho biết \(z\) có thể được định nghĩa là nhật ký xác suất của nhãn \(1\) (ví dụ: "dog barks") chia cho xác suất của nhãn \(0\)(ví dụ: "chó không&hl=vi;>

$$ z = \log\left(\frac{y}{1-y}\right) $$

Dưới đây là hàm sigmoid có nhãn máy học:

Hàm {2}

Hình 2: Đầu ra hồi quy logic.