Apa yang dimaksud dengan Machine Learning?

Machine learning (ML) mendukung beberapa teknologi terpenting yang kami gunakan, mulai dari aplikasi terjemahan hingga kendaraan otonom. Kursus ini menjelaskan konsep inti di balik ML.

ML menawarkan cara baru untuk memecahkan masalah, menjawab pertanyaan kompleks, dan membuat konten baru. ML dapat memprediksi cuaca, memperkirakan waktu perjalanan, merekomendasikan lagu, melengkapi kalimat secara otomatis, meringkas artikel, dan membuat gambar yang belum pernah dilihat sebelumnya.

Secara dasar, ML adalah proses pelatihan software, yang disebut model, untuk membuat prediksi yang berguna atau menghasilkan konten dari data.

Misalnya, kita ingin membuat aplikasi untuk memprediksi curah hujan. Kita bisa menggunakan pendekatan tradisional atau ML. Dengan menggunakan pendekatan tradisional, kita akan membuat representasi berbasis fisika dari atmosfer dan permukaan Bumi, yang menghitung sejumlah besar persamaan dinamika fluida. Ini sangat sulit.

Dengan menggunakan pendekatan ML, kami akan memberi model ML data cuaca yang sangat banyak hingga model ML akhirnya mempelajari hubungan matematis antara pola cuaca yang menghasilkan jumlah hujan yang berbeda. Kemudian kita akan memberikan data cuaca saat ini kepada model ini, dan model akan memprediksi jumlah hujan.

Memeriksa Pemahaman Anda

Apa yang dimaksud dengan "model" dalam machine learning?
Model adalah hubungan matematis yang berasal dari data yang digunakan sistem ML untuk membuat prediksi
Model adalah bagian dari perangkat keras komputer
Model adalah representasi yang lebih kecil dari hal yang Anda pelajari.

Jenis Sistem ML

Sistem ML dibagi ke dalam satu atau beberapa kategori berikut berdasarkan cara sistem tersebut belajar membuat prediksi atau menghasilkan konten:

  • Pembelajaran yang diawasi
  • Pembelajaran yang tidak diawasi
  • Reinforcement learning
  • Generative AI

Pembelajaran yang diawasi

Model Supervised learning dapat membuat prediksi setelah melihat banyak data dengan jawaban yang benar, lalu menemukan hubungan antara elemen dalam data yang menghasilkan jawaban yang benar. Hal ini ibarat siswa yang mempelajari materi baru dengan mempelajari ujian lama yang terdiri dari pertanyaan dan jawaban. Setelah dilatih dalam ujian lama yang cukup, siswa akan siap untuk mengikuti ujian baru. Sistem ML ini "diawasi" dalam arti bahwa manusia memberikan data sistem ML dengan hasil benar yang diketahui.

Dua kasus penggunaan paling umum untuk supervised learning adalah regresi dan klasifikasi.

Metrik

Model regresi memprediksi nilai numerik. Misalnya, model cuaca yang memprediksi jumlah hujan, dalam inci atau milimeter, adalah model regresi.

Lihat tabel di bawah untuk contoh model regresi lainnya:

Skenario Data input yang mungkin Prediksi numerik
Harga rumah masa depan Rekaman persegi, kode pos, jumlah kamar tidur dan kamar mandi, ukuran lot, suku bunga hipotek, tarif pajak properti, biaya konstruksi, dan jumlah rumah yang dijual di area tersebut. Harga rumah.
Waktu perjalanan mendatang Histori kondisi lalu lintas (dikumpulkan dari smartphone, sensor lalu lintas, transportasi online, dan aplikasi navigasi lainnya), jarak dari tempat tujuan, dan kondisi cuaca. Waktu dalam menit dan detik untuk tiba di tujuan.

Metrik

Model klasifikasi memprediksi kemungkinan bahwa sesuatu termasuk dalam suatu kategori. Tidak seperti model regresi, yang outputnya berupa angka, model klasifikasi menghasilkan nilai yang menyatakan apakah sesuatu termasuk dalam kategori tertentu atau tidak. Misalnya, model klasifikasi digunakan untuk memprediksi apakah suatu email adalah spam atau apakah foto berisi kucing.

Model klasifikasi dibagi menjadi dua kelompok: klasifikasi biner dan klasifikasi kelas jamak. Model klasifikasi biner menghasilkan nilai dari class yang hanya berisi dua nilai, misalnya, model yang menghasilkan rain atau no rain. Model klasifikasi multiclass menghasilkan nilai dari class yang berisi lebih dari dua nilai, misalnya, model yang dapat menghasilkan rain, hail, snow, atau sleet.

Memeriksa Pemahaman Anda

Jika Anda ingin menggunakan model ML untuk memprediksi penggunaan energi pada bangunan komersial, jenis model apa yang akan Anda gunakan?
Metrik
Penggunaan energi diukur dalam kilowattjam (kWh), yang merupakan angka, jadi sebaiknya Anda menggunakan model regresi.
Metrik
Model klasifikasi memprediksi apakah suatu hal termasuk dalam suatu kategori atau tidak, sedangkan model regresi memprediksi angka. Karena penggunaan energi diukur dalam kilowatt-jam (kWh), yang merupakan angka, Anda perlu menggunakan model regresi.

Pembelajaran yang tidak diawasi

Model Unsupervised learning membuat prediksi dengan diberi data yang tidak berisi jawaban yang benar. Tujuan model unsupervised learning adalah mengidentifikasi pola yang bermakna di antara data. Dengan kata lain, model tidak memiliki petunjuk tentang cara mengkategorikan setiap bagian data, tetapi model tersebut harus menyimpulkan aturannya sendiri.

Model unsupervised learning yang umum digunakan menggunakan teknik yang disebut pengelompokan. Model ini menemukan titik data yang mendemarkasi pengelompokan alami.

Gambar yang menunjukkan titik-titik berwarna dalam kelompok.

Gambar 1. Model ML yang mengelompokkan titik data serupa.

Gambar yang menampilkan titik-titik berwarna dalam kumpulan yang diapit suatu bentuk dan saling berbatasan.

Gambar 2. Grup klaster dengan demarkasi alami.

Pengelompokan berbeda dengan klasifikasi karena kategori tidak ditentukan oleh Anda. Misalnya, model yang tidak diawasi mungkin mengelompokkan set data cuaca berdasarkan suhu, sehingga menunjukkan segmentasi yang menentukan musim. Selanjutnya Anda bisa mencoba menamai klaster tersebut berdasarkan pemahaman Anda tentang set data.

Gambar yang menunjukkan titik-titik berwarna dalam kelompok yang diberi label salju, hujan, hujan es, dan tidak ada hujan.

Gambar 3. Model ML yang mengelompokkan pola cuaca serupa.

Gambar yang menunjukkan titik-titik berwarna dalam kelompok yang diberi label salju, hujan, hujan es, dan tidak ada hujan yang tertutup suatu bentuk dan saling berbatasan.

Gambar 4. Kumpulan pola cuaca yang diberi label sebagai salju, hujan es, hujan, dan tidak ada hujan.

Memeriksa Pemahaman Anda

Apa yang membedakan pendekatan yang diawasi dengan pendekatan yang tidak diawasi?
Pendekatan yang diawasi diberi data yang berisi jawaban yang benar.
Pendekatan yang diawasi diberi data yang berisi jawaban yang benar. Tugas model adalah menemukan koneksi dalam data yang menghasilkan jawaban yang benar. Pendekatan unsupervised diberikan data tanpa jawaban yang benar. Tugasnya adalah menemukan pengelompokan dalam data.
Pendekatan yang diawasi biasanya menggunakan pengelompokan.
Pendekatan unsupervised menggunakan pengelompokan.
Pendekatan unsupervised tahu cara memberi label cluster data.
Pendekatan unsupervised tidak tahu apa arti cluster data. Berdasarkan pemahaman Anda tentang data, Anda bebas mendefinisikannya.

Reinforcement learning

Model Reinforcement Learning membuat prediksi dengan mendapatkan reward atau hukuman berdasarkan tindakan yang dilakukan dalam lingkungan. Sistem pembelajaran penguatan menghasilkan kebijakan yang menentukan strategi terbaik untuk mendapatkan reward terbanyak.

Reinforcement learning digunakan untuk melatih robot agar dapat melakukan tugas seperti berjalan di sekitar ruangan, dan program software seperti AlphaGo untuk memainkan game Go.

Generative AI

AI Generatif adalah class model yang membuat konten dari input pengguna. Misalnya, AI generatif dapat membuat gambar, komposisi musik, dan lelucon unik; AI generatif dapat meringkas artikel, menjelaskan cara melakukan tugas, atau mengedit foto.

AI generatif dapat mengambil berbagai input dan membuat berbagai output, seperti teks, gambar, audio, dan video. Alat ini juga dapat mengambil dan membuat kombinasi dari semua ini. Misalnya, model dapat mengambil gambar sebagai input dan membuat gambar dan teks sebagai output, atau mengambil gambar dan teks sebagai input dan membuat video sebagai output.

Kita dapat membahas model generatif menurut input dan output-nya, yang biasanya ditulis sebagai jenis output "jenis input" ke "". Misalnya, berikut ini adalah sebagian daftar input dan output untuk model generatif:

  • Teks ke teks
  • Teks ke gambar
  • Teks ke video
  • Teks ke kode
  • Text to speech
  • Gambar dan teks ke gambar

Tabel berikut mencantumkan contoh model generatif, inputnya, dan contoh kemungkinan outputnya:

Model Input Contoh output
Teks ke teks Siapa penemu ras Le Mans? 24 Hours of Le Mans didirikan oleh Automobile Club de l'Ouest (ACO), sebuah organisasi otomotif yang didirikan pada tahun 1906. Balapan pertama diadakan pada 26 dan 27 Mei 1923 di Sarthe Circuit, sebuah sirkuit jalan sepanjang 13,426 kilometer (8,345 mil) yang terletak di dekat kota Le Mans di Prancis. Perlombaan ini awalnya dimaksudkan sebagai cara untuk mempromosikan ACO dan wilayah Sarthe.
Sumber: Bard
Teks ke gambar Gurita alien melayang di portal untuk membaca koran. Gambar kartun gurita.
Sumber: Imagen
Teks ke video Boneka beruang yang tampak realistis sedang berenang di laut di San Francisco. Beruang boneka itu terjebak di bawah air. Beruang teddy terus berenang di bawah air bersama ikan warna-warni. Beruang panda berenang di bawah air. Video boneka beruang berenang di bawah air.
Sumber: Phenaki
Teks ke kode Tulis loop Python yang melakukan loop pada daftar angka dan mencetak bilangan prima.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

Sumber: Bard
Gambar ke teks Gambar flamingo. Ini flamingo. Mereka ditemukan di Karibia.
Sumber: Google DeepMind

Bagaimana cara kerja AI generatif? Pada dasarnya, model generatif mempelajari pola dalam data dengan tujuan untuk menghasilkan data baru yang serupa. Model generatif adalah seperti berikut ini:

  • Komedian yang belajar meniru orang lain dengan mengamati perilaku dan gaya berbicara orang
  • Seniman yang belajar melukis dengan gaya tertentu dengan mempelajari banyak lukisan dengan gaya itu
  • Buat lagu untuk band yang belajar terdengar seperti grup musik tertentu dengan mendengarkan banyak musik dari kelompok tersebut

Untuk menghasilkan output yang unik dan kreatif, model generatif awalnya dilatih menggunakan pendekatan yang tidak diawasi, di mana model belajar untuk meniru data yang digunakan untuk melatihnya. Model ini terkadang dilatih lebih lanjut menggunakan pembelajaran yang diawasi atau penguatan pada data tertentu yang terkait dengan tugas yang mungkin diminta untuk dilakukan model, misalnya, meringkas artikel atau mengedit foto.

AI generatif adalah teknologi yang berkembang cepat dengan kasus penggunaan baru yang terus ditemukan. Misalnya, model generatif membantu bisnis meningkatkan kualitas gambar produk e-commerce mereka dengan otomatis menghapus latar belakang yang mengganggu atau meningkatkan kualitas gambar beresolusi rendah.