Öğrendiklerinizi Test Etme

Aşağıdaki sorular, temel makine öğrenimi kavramlarına dair bilgilerinizi pekiştirmenize yardımcı olur.

Tahmin gücü

Gözetimli makine öğrenimi modelleri, etiketli örnekler içeren veri kümeleri kullanılarak eğitilir. Model, özelliklerden etiketin nasıl tahmin edileceğini öğrenir. Ancak veri kümesindeki her özellik tahmine dayalı güce sahip değildir. Bazı durumlarda yalnızca birkaç özellik etiketin öngörüsü işlevi görür. Aşağıdaki veri kümesinde, fiyatı etiket, geri kalan sütunları özellik olarak kullanın.

Otomobil özelliklerinin etiketli bir örneği.

Sizce bir arabanın fiyatını belirleyen en önemli üç özellik hangileridir?
Marka_model, yıl, mil.
Bir otomobilin markası/modeli, yılı ve kilometresi muhtemelen fiyatı için en önemli göstergeler arasındadır.
Renk, yükseklik, model_model.
Arabanın yüksekliği ve rengi, araba fiyatıyla ilgili önemli göstergeler değildir.
Mil, dişli kutusu, model_model.
Dişli kutusu, fiyatı belirleyen ana gösterge değildir.
Lastik boyutu, lastik tabanı, yıl.
Lastik boyutu ve tekerlek tabanı, arabanın fiyatıyla ilgili önemli göstergeler değildir.

Gözetimli ve gözetimsiz öğrenim

Soruna bağlı olarak, denetimli veya denetlenmeyen bir yaklaşım kullanırsınız. Örneğin, tahmin etmek istediğiniz değeri veya kategoriyi önceden biliyorsanız gözetimli öğrenimi kullanırsınız. Ancak, veri kümenizin herhangi bir segmentasyon veya ilgili örneklerden oluşan gruplandırmalar içerip içermediğini öğrenmek istiyorsanız gözetimsiz öğrenmeyi kullanırsınız.

Bir online alışveriş web sitesi için kullanıcıların bulunduğu bir veri kümeniz olduğunu ve bu veri kümesinin aşağıdaki sütunları içerdiğini varsayalım:

Müşteri özellikleri satırının resmi.

Siteyi ziyaret eden kullanıcı türlerini anlamak istediğinizde gözetimli öğrenimi mi yoksa gözetimsiz öğrenimi mi kullanırdınız?
Gözetimsiz öğrenme.
Modelin ilgili müşterilerden oluşan grupları kümelemesini istediğimiz için gözetimsiz öğrenmeyi kullanırdık. Model kullanıcıları kümeledikten sonra her küme için kendi adlarımızı oluştururduk. Örneğin, "indirim arayanlar", "fırsat avcıları", "sörfçüler", "sadık" ve "gezginler".
Gözetimli öğrenme çünkü bir kullanıcının hangi sınıfa ait olduğunu tahmin etmeye çalışıyorum.
Gözetimli öğrenmede, veri kümesi tahmin etmeye çalıştığınız etiketi içermelidir. Veri kümesinde, kullanıcı kategorisini belirten herhangi bir etiket yoktur.

Evler için aşağıdaki sütunlara sahip bir enerji kullanımı veri kümenizin olduğunu varsayalım:

Home özellikleri satırının resmi.

Yeni inşa edilmiş bir evin yıllık kilovat saat cinsinden değerini tahmin etmek için ne tür bir makine öğrenimi kullanılır?
Gözetimli öğrenme.
Gözetimli öğrenme, etiketli örneklerle eğitilir. Bu veri kümesinde, modelin tahmin etmesini istediğiniz değer "yılda kullanılan kilovat saat" olur. Özellikler "kare metre", "konum" ve "inşaat yılı" olabilir.
Gözetimsiz öğrenme.
Gözetimsiz öğrenmede etiketlenmemiş örnekler kullanılır. Bu örnekte, modelin tahmin etmesini istediğiniz değer olduğundan "yıllık kullanılan kilovat saat" etiket olur.

Aşağıdaki sütunları içeren bir uçuş veri kümeniz olduğunu varsayalım:

Uçuş verileri satırını gösteren resim.

Otobüs biletinin maliyetini tahmin etmek isteseydiniz regresyonu mu yoksa sınıflandırmayı mı kullanırsınız?
Regresyon
Regresyon modelinin çıkışı sayısal bir değerdir.
Sınıflandırma
Sınıflandırma modelinin çıkışı ayrı bir değerdir, normalde bir kelimedir. Bu durumda, otobüs bileti ücreti sayısal bir değerdir.
Veri kümesine göre, otobüs biletinin maliyetini "yüksek", "ortalama" veya "düşük" olarak sınıflandıracak bir sınıflandırma modeli eğitebilir misiniz?
Evet, ancak önce coach_ticket_cost sütunundaki sayısal değerleri kategorik değerlere dönüştürmemiz gerekir.
Veri kümesinden bir sınıflandırma modeli oluşturmak mümkündür. Bunun için aşağıdaki gibi bir işlem yapmanız gerekir:
  1. Kalkış havaalanından varış havaalanına giden bir biletin ortalama maliyetini bulun.
  2. "Yüksek", "ortalama" ve "düşük" olarak kabul edilecek eşikleri belirleyin.
  3. Tahmin edilen maliyeti eşiklerle karşılaştırın ve değerin dahil olduğu kategoriyi oluşturun.
Hayır. Sınıflandırma modeli oluşturulamaz. coach_ticket_cost değerleri kategorik değil, sayısal değerlerdir.
Biraz çalışarak sınıflandırma modeli oluşturabilirsiniz.
Hayır. Sınıflandırma modelleri yalnızca spam veya not_spam gibi iki kategoriyi tahmin eder. Bu modelin üç kategoriyi tahmin etmesi gerekir.
Sınıflandırma modelleri birden fazla kategoriyi tahmin edebilir. Bunlara çok sınıflı sınıflandırma modelleri denir.

Eğitim ve değerlendirme

Bir modeli eğittikten sonra, etiketli örnekler içeren bir veri kümesi kullanarak modeli değerlendirir ve modelin tahmin edilen değerini etiketin gerçek değeriyle karşılaştırırız.

Soru için en uygun iki yanıtı seçin.

Modelin tahminleri çok uzaktaysa onları daha iyi hale getirmek için ne yapabilirsiniz?
Modeli yeniden eğitin ancak yalnızca etiket için en güçlü tahmin gücüne sahip olduğunu düşündüğünüz özellikleri kullanın.
Modeli daha az özellikle daha tahmin gücüne sahip olacak şekilde yeniden eğitmek, daha iyi tahminler yapan bir model üretebilir.
Tahminleri çok uzak olan bir modeli düzeltemezsiniz.
Tahminleri yanlış olan bir modeli düzeltmek mümkündür. Çoğu model, faydalı tahminlerde bulunana kadar birden fazla eğitim gerektirir.
Daha büyük ve daha çeşitli bir veri kümesi kullanarak modeli yeniden eğitin.
Daha fazla örnek ve daha geniş bir değer aralığına sahip veri kümeleriyle eğitilen modeller, özellikler ile etiket arasındaki ilişki için daha genelleştirilmiş bir çözümü olduğundan daha iyi tahminler üretebilir.
Farklı bir eğitim yaklaşımı deneyin. Örneğin, gözetimli bir yaklaşım kullandıysanız denetlenmeyen bir yaklaşım deneyin.
Farklı bir eğitim yaklaşımı kullanmak daha iyi tahminler üretemez.

Makine öğrenimi yolculuğunuzda bir sonraki adımı atmaya hazırsınız:

  • Kişiler + Yapay Zeka Rehberi. Google çalışanları, sektör uzmanları ve makine öğreniminin kullanımıyla ilgili akademik araştırmalar tarafından sunulan yöntemler, en iyi uygulamalar ve örneklere bakın.

  • Sorun Çerçeveleme. ML modelleri oluşturmak ve süreçteki yaygın tehlikelerden kaçınmak için sahada test edilmiş bir yaklaşım arıyorsanız.

  • Machine Learning Crash Course. Makine öğrenimi hakkında daha fazla bilgi edinmeye yönelik ayrıntılı ve uygulamalı bir yaklaşıma hazırsanız.