Turun ke ML: Regresi Linear

Sudah lama diketahui bahwa jangkrik (spesies serangga) lebih sering berbunyi pada hari-hari yang lebih panas daripada pada hari-hari yang lebih dingin. Selama beberapa dekade, para ilmuwan profesional dan amatir telah membuat katalog data tentang bunyi kerik per menit dan suhu. Sebagai hadiah ulang tahun, Bibi Ruth memberi Anda database kriket dan meminta Anda untuk mempelajari model guna memprediksi hubungan ini. Dengan menggunakan data ini, Anda ingin mempelajari hubungan ini.

Pertama-tama, periksa data Anda dengan memetakannya:

Data mentah bunyi kerik/menit (sumbu x) vs. suhu (sumbu y).

Gambar 1. Bunyi kerik per Menit vs. Suhu dalam Celsius.

Seperti yang diharapkan, plot menunjukkan suhu yang meningkat seiring dengan jumlah bunyi kerik. Apakah hubungan antara bunyi kerik dan suhu ini linear? Ya, Anda dapat menggambar satu garis lurus seperti berikut untuk memperkirakan hubungan ini:

Garis terbaik yang menetapkan hubungan kerik/menit (sumbu x) vs. suhu (sumbu y).

Gambar 2. Hubungan linear.

Benar, garis tidak melewati setiap titik, tetapi garis tersebut menunjukkan dengan jelas hubungan antara bunyi kerik dan suhu. Dengan menggunakan persamaan untuk garis, Anda dapat menuliskan hubungan ini sebagai berikut:

$$ y = mx + b $$

dalam hal ini:

  • \(y\) adalah suhu dalam Celsius—nilai yang coba kami prediksi.
  • \(m\) adalah kemiringan garis.
  • \(x\) adalah jumlah kerik per menit—nilai fitur input kami.
  • \(b\) merupakan titik potong sumbu y.

Berdasarkan konvensi dalam machine learning, Anda akan menulis persamaan untuk model yang sedikit berbeda:

$$ y' = b + w_1x_1 $$

dalam hal ini:

  • \(y'\) adalah label yang diprediksi (output yang diinginkan).
  • \(b\) adalah bias (intersep y), terkadang disebut sebagai \(w_0\).
  • \(w_1\) adalah bobot fitur 1. Bobot adalah konsep yang sama dengan "kemiringan" \(m\) dalam persamaan tradisional suatu garis.
  • \(x_1\) adalah fitur (input yang diketahui).

Untuk menyimpulkan (memprediksi) suhu \(y'\) untuk nilai chip per menit baru \(x_1\), cukup ganti \(x_1\) nilai ke dalam model ini.

Meskipun model ini hanya menggunakan satu fitur, model yang lebih canggih mungkin mengandalkan beberapa fitur, masing-masing memiliki bobot terpisah (\(w_1\), \(w_2\), dll.). Misalnya, model yang bergantung pada tiga fitur mungkin terlihat seperti berikut:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$