Jaringan neural

Anda mungkin ingat dari Latihan persilangan fitur di Modul data kategoris, bahwa masalah klasifikasi berikut adalah nonlinear:

Gambar 1. Bidang koordinat Kartesius, dibagi menjadi empat
      kuadran, masing-masing berisi titik-titik acak 
dalam bentuk yang menyerupai
      persegi. Titik-titik di kuadran kanan atas dan kiri bawah berwarna biru,
      dan titik-titik di kuadran kiri atas dan kanan bawah berwarna oranye.
Gambar 1. Masalah klasifikasi non-linear. Fungsi linear tidak dapat memisahkan semua titik biru dari titik oranye dengan jelas.

"Nonlinear" berarti Anda tidak dapat memprediksi label secara akurat dengan model bentuk \(b + w_1x_1 + w_2x_2\). Dengan kata lain, "permukaan keputusan" bukanlah garis.

Namun, jika kita melakukan persilangan fitur pada fitur $x_1$ dan $x_2$, kita bisa kemudian merepresentasikan hubungan nonlinier antara kedua fitur menggunakan model linear: $b + w_1x_1 + w_2x_2 + w_3x_3$ di mana $x_3$ adalah persilangan fitur antara $x_1$ dan $x_2$:

Gambar 2. Bidang koordinat Kartesius yang sama berwarna biru dan oranye
      titik-titik seperti pada Gambar 1.  Namun, kali ini kurva hiperbolik putih
      diplot di atas {i>grid<i}, yang memisahkan titik-titik biru di kanan atas
      dan kuadran kiri bawah (sekarang diarsir dengan latar belakang biru) dari
      titik oranye di kuadran kiri atas dan kanan bawah (sekarang
      diarsir dengan latar belakang oranye).
Gambar 2. Dengan menambahkan persilangan fitur, x1x2, model linear dapat mempelajari bentuk hiperbolik yang memisahkan titik biru dari titik oranye.

Sekarang perhatikan {i>dataset<i} berikut ini:

Gambar 3. Bidang koordinat Kartesius, yang dibagi menjadi empat kuadran.
      Cluster melingkar titik biru berpusat pada asal
      grafik, dan dikelilingi oleh lingkaran titik oranye.
Gambar 3. Masalah klasifikasi non-linear yang lebih sulit.

Anda mungkin juga ingat Latihan silang fitur yang menentukan persilangan fitur yang tepat untuk menyesuaikan model linear dengan data ini membutuhkan lebih banyak usaha dan eksperimen.

Namun, bagaimana jika Anda tidak perlu melakukan semua eksperimen itu sendiri? Jaringan neural adalah kelompok arsitektur model yang dirancang untuk menemukan nonlinear pola yang berbeda dalam data. Selama pelatihan jaringan neural, model secara otomatis mempelajari persilangan fitur yang optimal untuk dilakukan pada data input guna meminimalkan kerugian.

Di bagian berikut, kita akan mempelajari lebih lanjut cara kerja jaringan saraf.