Makine Öğrenimi Sözlüğü: Resim Modelleri

Bu sayfa Resim Modelleri sözlüğü terimlerini içerir. Tüm sözlük terimleri için burayı tıklayın.

CEVAP

artırılmış gerçeklik

#image

Bilgisayarla oluşturulmuş bir görüntüyü kullanıcının gerçek dünya görüntüsünün üzerine bindirerek birleşik bir görünüm sağlayan teknoloji.

otomatik kodlayıcı

#language
#image

Girişten en önemli bilgileri çıkarmayı öğrenen bir sistem. Otomatik kodlayıcılar, kodlayıcı ve kod çözücü kombinasyonudur. Otomatik kodlayıcılar, aşağıdaki iki adımlı süreci kullanır:

  1. Kodlayıcı, girişi (tipik olarak) kayıplı, düşük boyutlu (orta) bir biçime eşler.
  2. Kod çözücü, düşük boyutlu biçimi orijinal daha yüksek boyutlu giriş biçimiyle eşleyerek orijinal girişin kayıplı bir sürümünü oluşturur.

Otomatik kodlayıcılar, kod çözücünün orijinal girişi kodlayıcının ara biçiminden mümkün olduğunca yakından yeniden oluşturmaya çalışmasını sağlayarak uçtan uca eğitilir. Ara biçim, orijinal biçimden daha küçük (düşük boyutlu) olduğundan, otomatik kodlayıcı, girişteki hangi bilgilerin gerekli olduğunu öğrenmeye zorlanır ve çıkış, girişle tamamen aynı olmaz.

Örneğin:

  • Giriş verileri bir grafikse, tam olmayan kopya orijinal grafiğe benzer, ancak bir şekilde değiştirilmiş olur. Belki de tam olmayan kopya, orijinal grafikteki gürültüyü giderir veya bazı eksik pikselleri doldurur.
  • Giriş verileri metinse otomatik kodlayıcı, orijinal metni taklit eden (ancak metinle aynı olmayan) yeni metin oluşturur.

Ayrıca çeşitli otomatik kodlayıcılar konusuna da bakın.

otomatik regresif model

#language
#image
#generativeAI

Kendi önceki tahminlerine dayanarak bir tahminde bulunan model. Örneğin, otomatik regresif dil modelleri, önceden tahmin edilen jetonlara dayalı olarak bir sonraki jetonu tahmin eder. Tüm Transformer tabanlı büyük dil modelleri otomatik regresiftir.

Buna karşılık GAN tabanlı görüntü modelleri, görüntüleri aşamalı olarak değil, tek bir ileriye doğru geçişte oluşturdukları için genellikle otomatik regresif değildir. Ancak bazı görüntü oluşturma modelleri, birkaç adımda görüntü oluşturdukları için otomatik regresif olur.

B

sınırlayıcı kutu

#image

Bir resimde, aşağıdaki resimde gösterilen köpek gibi, ilgilenilen bir alanın çevresindeki dikdörtgenin (x, y) koordinatları.

Kanepede oturan bir köpeğin fotoğrafı. Köpeğin vücudunu çevreleyen, sol üst koordinatları (275, 1271) ve sağ alt koordinatları (2954, 2761) olan yeşil bir sınırlayıcı kutu

C

konvolüsyon

#image

Matematikte, gündelik hayatta iki işlevin bir karışımıdır. Makine öğreniminde, bir kıvrım, ağırlıkları eğitmek için evrimsel filtre ile giriş matrisini karıştırır.

Makine öğrenimindeki "evrim" terimi, genellikle evrimsel işlem veya evrimsel katman terimlerinin kısaltılmış halidir.

Konvolüsyonlar olmadığında, makine öğrenimi algoritmasının büyük bir tensördeki her hücre için ayrı bir ağırlık öğrenmesi gerekir. Örneğin, 2.000 x 2.000 görüntüler üzerinde eğiten bir makine öğrenimi algoritmasının 4 milyon ayrı ağırlık bulması gerekir. Konvolüsyonlar sayesinde bir makine öğrenimi algoritmasının yalnızca evrimsel filtredeki her hücre için ağırlık bulması yeterli olur. Bu sayede, modeli eğitmek için gereken bellek önemli ölçüde azalır. Konvolüsyonel filtre uygulandığında, bu filtre hücreler arasında kopyalanarak her biri filtreyle çarpılır.

kıvrımlı filtre

#image

Bir devrimsel operasyontaki iki oyuncudan biri. (Diğer aktör, giriş matrisinin bir dilimi.) Evrimsel filtre, giriş matrisiyle aynı sıralamaya sahip ancak daha küçük bir şekle sahip matristir. Örneğin, 28x28 boyutlarında bir giriş matrisi söz konusu olduğunda filtre, 28x28’den küçük herhangi bir 2D matris olabilir.

Fotoğrafik işlemede, kıvrımlı bir filtredeki tüm hücreler genellikle sabit birler ve sıfırlardan oluşan sabit bir desene ayarlanır. Makine öğreniminde, evrişimsel filtreler genellikle rastgele sayılarla başlatılır ve ardından ağ, ideal değerleri etirir.

kıvrımlı katman

#image

İçinden bir giriş matrisi boyunca evrimsel filtrenin geçtiği derin nöral ağ katmanı. Örneğin, şu 3x3 evrimsel filtreyi ele alalım:

Şu değerlere sahip 3x3 bir matris: [[0,1,0], [1,0,1], [0,1,0]]

Aşağıdaki animasyon, 5x5 giriş matrisini içeren 9 evrimsel işlemden oluşan kıvrımlı bir katmanı göstermektedir. Her evrilerek yapılan işlemin, giriş matrisinin 3x3'lük farklı bir diliminde çalıştığına dikkat edin. Ortaya çıkan 3x3 matris (sağda), 9 evrimsel işlemin sonuçlarından oluşur:

İki matrisi gösteren animasyon. İlk matris, 5x5
          matrisidir: [[128,97,53,201,198], [35,22,25,200,195],
          [37,24,28,197,182], [33,28,92,190,92,190,1717,195][128,97,53,201,198], [35,22,25,200,195]
          İkinci matris, 3x3 boyutunda matristir:
          [[181.303.618], [115.338.605], [169.351.560]].
          İkinci matris, 5x5 matrisin farklı 3x3 alt kümelerine kıvrımlı filtre [[0, 1, 0], [1, 0, 1], [0, 1, 0]] uygulanarak hesaplanır.

konvolüsyonel nöral ağ

#image

En az bir katmanın evrimsel katman olduğu bir nöral ağ. Tipik bir evrişimsel nöral ağ, aşağıdaki katmanların bir kombinasyonundan oluşur:

Evrimsel nöral ağlar, görüntü tanıma gibi belirli problemlerde büyük başarı elde etti.

kıvrımlı işlem

#image

Aşağıdaki iki adımlı matematik işlemi:

  1. Dönüşümsel filtre ile bir giriş matrisi diliminin öğe bazında çarpımı. (Giriş matrisinin dilimi, kıvrımlı filtre ile aynı sıralamaya ve boyuta sahiptir.)
  2. Ortaya çıkan ürün matrisindeki tüm değerlerin toplamı.

Örneğin, aşağıdaki 5x5 giriş matrisini ele alalım:

5x5 matrisi: [[128,97,53,201,198], [35,22,25,200,195],
          [37,24,28,197,182], [33,28,92,175,170], [10,10,4]

Şimdi aşağıdaki 2x2 kıvrımlı filtreyi hayal edin:

2x2 matrisi: [[1, 0], [0, 1]]

Her kıvrımlı işlem, giriş matrisinin 2x2 boyutunda tek bir dilimini içerir. Örneğin, giriş matrisinin sol üst kısmında bulunan 2x2 boyutunda bir dilimi kullandığımızı varsayalım. Dolayısıyla, bu dilimdeki konvolüsyon işlemi aşağıdaki gibi görünür:

Giriş matrisinin sol üstteki 2x2 bölümüne ([[128,97] [35,22]]) kıvrımlı filtre [[1, 0], [0, 1]] uygulanıyor.
          Konvolüsyonel filtre, 128 ve 22 değerlerini olduğu gibi bırakır, ancak 97 ve 35 değerlerini sıfırlar. Sonuç olarak, konvolüsyon işlemi 150 (128+22) değerini verir.

Evrimsel katman, her biri giriş matrisinin farklı bir dilimi üzerinde işlem yapan bir dizi kıvrımlı işlemden oluşur.

D

veri genişletme

#image

Ek örnekler oluşturmak için mevcut örnekleri dönüştürüp eğitim örneklerinin kapsamını ve sayısını yapay olarak artırma. Örneğin, görüntülerin özelliklerinizden biri olduğunu ancak veri kümenizin, modelin faydalı ilişkilendirmeleri öğrenmesi için yeterli görüntü örneği içermediğini varsayalım. İdeal olarak, modelinizin düzgün şekilde eğitilmesi için veri kümenize yeterli miktarda etiketli görüntü eklemeniz gerekir. Bu mümkün değilse veri genişletme, orijinal resmin birçok varyantını oluşturmak için her resmi döndürebilir, uzatabilir ve yansıtabilir. Bu da, muhtemelen mükemmel bir eğitim için yeterli sayıda etiketli veri elde edilmesini sağlayabilir.

derinlemesine olarak ayrılabilir kıvrımlı nöral ağ (sepCNN)

#image

Inception'ı temel alan ancak Inception modüllerinin derinlemesine ayrılabilen evrimlerle değiştirildiği bir evrimsel nöral ağ mimarisi. Xception olarak da bilinir.

Derinlemesine ayrılabilen konvolüsyon (ayrılabilir konvolüs olarak da kısaltılır), standart bir 3 boyutlu evrimi, daha hesaplama açısından daha verimli olan iki ayrı evrim işlemeye dönüştürür: Birincisi, derinliği 1 olan derinlikli kıvrım ({0}uzunluk ve genişlik 1, nokta genişliğinde x ve kıvrım 1) ve ikincisi, hesaplama açısından daha verimli olan iki ayrı evrim işlemesi.

Daha fazla bilgi edinmek için Xception: Depthwise Reparable Conolutions (Derinlemesine Ayrılabilir Dönüşümlerle Derin Öğrenme) konusuna bakın.

aşağı örnekleme

#image

Aşağıdaki durumlardan biri anlamına gelebilecek aşırı yüklenmiş terim:

  • Bir modeli daha verimli şekilde eğitmek için bir özellikteki bilgi miktarını azaltma. Örneğin, bir görüntü tanıma modelini eğitmeden önce, yüksek çözünürlüklü resimlerden daha düşük çözünürlüklü bir biçime aşağı örnekleme işlemi uygulanabilir.
  • Yeterince temsil edilmeyen sınıflarda model eğitimini iyileştirmek için, yeterince temsil edilmeyen sınıf örneklerinin orantısız bir şekilde düşük yüzdesiyle ilgili eğitim. Örneğin, sınıf dengesiz bir veri kümesinde modeller, çoğunluk sınıfı hakkında çok fazla bilgi edinme eğilimi gösterirken azınlık sınıfı hakkında yeterli bilgi edinmez. Aşağı örnekleme, çoğunluk ve azınlık sınıflarıyla ilgili eğitim miktarını dengelemeye yardımcı olur.

F

ince ayar

#language
#image
#generativeAI

Önceden eğitilmiş bir modelde gerçekleştirilen göreve özel ikinci bir eğitim geçişi, modelin parametrelerini belirli bir kullanım alanına göre hassaslaştırıyor. Örneğin, bazı büyük dil modelleri için tam eğitim sırası aşağıdaki gibidir:

  1. Ön eğitim: Tüm İngilizce Wikipedia sayfaları gibi geniş bir genel veri kümesiyle büyük bir dil modelini eğitin.
  2. Hassas ayarlama: Önceden eğitilmiş modeli, tıbbi sorgulara yanıt verme gibi belirli bir görevi gerçekleştirecek şekilde eğitin. İnce ayarlar genellikle belirli bir göreve odaklanan yüz veya binlerce örnek içerir.

Başka bir örnek olarak, büyük bir resim modeli için tam eğitim sırası aşağıdaki gibidir:

  1. Ön eğitim: Wikimedia Commons'taki tüm resimler gibi büyük bir genel resim veri kümesinde büyük bir resim modelini eğitin.
  2. Hassas ayarlama: Önceden eğitilmiş modeli, orkaların görüntülerini oluşturma gibi belirli bir görevi gerçekleştirecek şekilde eğitin.

Hassas ayarlamalar yapmak için aşağıdaki stratejilerin herhangi bir kombinasyonu gerekebilir:

  • Önceden eğitilmiş modelin mevcut parametrelerinin tümünü değiştirme. Buna bazen tam ince ayar denir.
  • Önceden eğitilmiş modelin mevcut parametrelerinin yalnızca bazılarını (genellikle çıkış katmanına en yakın katmanlar) değiştirirken diğer mevcut parametreleri değiştirmeden (tipik olarak, katmanlar giriş katmanına en yakın olan katmanlar) değiştirilir. Parametre etkili ayarlama bölümünü inceleyin.
  • Genellikle çıkış katmanına en yakın mevcut katmanların üzerine daha fazla katman ekleme.

İnce ayar, bir öğrenme aktarma biçimidir. Bu nedenle, ince ayarda, önceden eğitilmiş modeli eğitmek için kullanılanlardan farklı bir kayıp işlevi veya farklı bir model türü kullanılabilir. Örneğin, giriş görüntüsündeki kuş sayısını döndüren bir regresyon modeli oluşturmak için, önceden eğitilmiş bir büyük görüntü modelinde ince ayar yapabilirsiniz.

İnce ayarları aşağıdaki terimlerle karşılaştırın:

G

üretken yapay zeka

#language
#image
#generativeAI

Resmi tanımı olmayan, dönüştürücü bir alan. Bununla birlikte, çoğu uzman, üretici yapay zeka modellerinin aşağıdakilerin tümüne sahip içerikler oluşturabileceği ("üretim") konusunda hemfikirdir:

  • karmaşık
  • tutarlı
  • orijinal

Örneğin, üretken yapay zeka modeli karmaşık makaleler ve görüntüler oluşturabilir.

LSTM ve RNN'ler gibi önceki bazı teknolojiler de orijinal ve tutarlı içerikler oluşturabilir. Bazı uzmanlar bu eski teknolojileri üretken yapay zeka olarak görürken diğerleri gerçek üretici yapay zekanın, önceki teknolojilerin üretebileceğinden daha karmaşık çıkışlar gerektirdiğini düşünüyor.

Tahmine dayalı makine öğrenimi ile kontrast oluşturun.

İ

resim tanıma

#image

Bir görseldeki nesneleri, desenleri veya kavramları sınıflandıran işlem. Görüntü tanıma, görüntü sınıflandırma olarak da bilinir.

Daha fazla bilgi için ML Pratikumu: Görüntü Sınıflandırma sayfasını inceleyin.

birleşim üzerinde kesişim (IoU)

#image

İki kümenin kesişiminin birleşimine bölümü. Makine öğrenimi görüntü algılama görevlerinde IoU, modelin tahmin edilen sınırlayıcı kutusunun kesin referans sınırlayıcı kutusuna göre doğruluğunu ölçmek için kullanılır. Bu durumda, iki kutunun IoU'su çakışan alan ile toplam alan arasındaki orandır ve değeri 0 (tahmini sınırlayıcı kutu ile kesin referans kutucuğu çakışması yok) 1 ile 1 (tahmini sınırlayıcı kutu ve kesin referans kutucuğu aynı koordinatlara sahiptir) arasında değişir.

Örneğin, aşağıdaki resimde:

  • Tahmin edilen sınırlayıcı kutu (modelin, resimdeki gece masasının konumunu tahmin ettiği konumu sınırlayan koordinatlar) mor renkle gösterilir.
  • Kesin referans sınırlayıcı kutu (resimdeki gece masasının gerçekte nerede bulunduğunu sınırlayan koordinatlar) yeşil renkle belirtilmiştir.

Van Gogh'un "Arles'de Vincent'ın Yatak Odası" resminde, yatağın yanındaki komodin etrafında iki farklı sınırlayıcı kutu gösteriliyor. Kesin referans kutusu (yeşil renkli), komodin masasını mükemmel şekilde tanımlar. Tahmin edilen sınırlayıcı kutu (mor renkli), %50 aşağı ve kesin referans sınırlama kutusunun sağ tarafında ofsettir. Bu kutu, gece tablosunun sağ alt çeyreğini kapsar ancak tablonun geri kalanı eksiktir.

Burada, tahmin ve kesin referans için sınırlayıcı kutuların (soldan altta) kesişimi 1'dir. Tahmin ile kesin referans için sınırlayıcı kutuların birleşimi (sağ altta) 7'dir. Dolayısıyla IoU \(\frac{1}{7}\)'dir.

Yukarıdakiyle aynı görüntü ancak her bir sınırlayıcı kutu dört çeyreğe bölünmüştür. Kesin referans sınır kutusunun sağ alt çeyreği ile tahmin edilen sınırlayıcı kutunun sol üst çeyreğinin birbiriyle çakıştığından toplam yedi çeyrek vardır. Bu örtüşen bölüm (yeşil renkle vurgulanmıştır), kavşağı temsil eder ve 1 alana sahiptir. Yukarıdakiyle aynı görüntü ancak her bir sınırlayıcı kutu dört çeyreğe bölünmüştür. Kesin referans sınır kutusunun sağ alt çeyreği ile tahmin edilen sınırlayıcı kutunun sol üst çeyreğinin birbiriyle çakıştığından toplam yedi çeyrek vardır.
          Her iki sınırlayıcı kutuyla (yeşil renkle vurgulanmış) çevrili olan iç kısmın tamamı birleşimi temsil eder ve 7'lik bir alana sahiptir.

K

önemli noktalar

#image

Bir resimdeki belirli özelliklerin koordinatları. Örneğin, çiçek türlerini ayırt eden bir görüntü tanıma modeli için anahtar noktalar her bir taç yaprağının merkezi, sap, erkeğin merkezi vb. olabilir.

L

önemli noktalar

#image

Anahtar noktaların eş anlamlısı.

M

MNIST

#image

LeCun, Cortes ve Burges tarafından derlenen, herkese açık bir veri kümesi olan ve her biri, bir insanın 0-9 arasındaki belirli bir basamağı nasıl manuel olarak yazdığını gösteren 60.000 görüntü içeriyor. Her görüntü, 28x28'lik bir tam sayı dizisi olarak depolanır. Burada her tam sayı, 0 ile 255 arasında (0 ve 255 dahil) gri tonlamalı bir değerdir.

MNIST, genellikle yeni makine öğrenimi yaklaşımlarını test etmek için kullanılan standart bir makine öğrenimi veri kümesidir. Ayrıntılı bilgi için MNIST El Yazısı Rakamları Veritabanı'na göz atın.

P

havuz

#image

Daha önceki bir evrimsel katman tarafından oluşturulan bir matrisin (veya matrislerin) daha küçük bir matrise indirgenmesi. Havuz işlemi genellikle havuz alanındaki maksimum veya ortalama değerin alınmasını içerir. Örneğin, aşağıdaki 3x3 matrisin olduğunu varsayalım:

3x3 matrisi [[5,3,1], [8,2,5], [9,4,3]].

Havuzlama işlemi, tıpkı kıvrımlı işlemlerde olduğu gibi bu matrisi dilimlere böler ve ardından bu kıvrımlı işlemi adımlar halinde kaydırır. Örneğin, havuzlama işleminin kıvrımlı matrisi 1x1 adımlarla 2x2 dilimlere böldüğünü varsayalım. Aşağıdaki diyagramda gösterildiği gibi, dört havuz oluşturma işlemi gerçekleşir. Her havuzlama işleminin bu dilimdeki dört maksimum değeri seçtiğini düşünün:

Giriş matrisi 3x3 boyutunda ve şu değerlerle birlikte: [[5,3,1], [8,2,5], [9,4,3]].
          Giriş matrisinin sol üstteki 2x2 alt matrisi [[5,3], [8,2]]'dir. Bu nedenle sol üstteki havuz oluşturma işlemi, 8 değerini verir (maksimum 5, 3, 8 ve 2). Giriş matrisinin sağ üstteki 2x2 alt matrisi [[3,1], [2,5]] şeklindedir. Bu nedenle sağ üst havuz oluşturma işlemi, 5 değerini verir. Giriş matrisinin sol alttaki 2x2 alt matrisi [[8,2], [9,4]] olduğundan sol alt havuzlama işlemi 9 değerini verir. Giriş matrisinin sağ alttaki 2x2 alt matrisi [[2,5], [4,3]] şeklindedir. Bu nedenle, sağ alt havuz oluşturma işlemi 5 değerini verir. Özetle, havuz oluşturma işlemi 2x2 matrisi verir [[8,5], [9,5]].

Havuzlama, giriş matrisinde çeviri sabitliğinin uygulanmasına yardımcı olur.

Görüntü uygulamaları için havuzlama, daha resmi olarak uzamsal havuzlama olarak bilinir. Zaman serisi uygulamalarında, genellikle havuzlama, geçici havuzlama olarak adlandırılır. Daha resmi olmayan şekilde, havuzlamaya genellikle alt örnekleme veya aşağı örnekleme denir.

önceden eğitilmiş model

#language
#image
#generativeAI

Eğitilmiş modeller veya model bileşenleri (yerleştirme vektör gibi). Bazen, önceden eğitilmiş yerleştirilmiş vektörleri bir nöral ağa feedlersiniz. Diğer durumlarda, modeliniz önceden eğitilmiş yerleştirmelere bağlı kalmak yerine yerleştirme vektörlerini eğitir.

Önceden eğitilmiş dil modeli terimi, eğitim öncesi süreçlerden geçmiş büyük bir dil modelini ifade eder.

ön eğitim

#language
#image
#generativeAI

Büyük bir veri kümesi üzerinde bir modelin ilk eğitimi. Bazı önceden eğitilmiş modeller sakar devlerdir ve genellikle ek eğitimlerle iyileştirilmesi gerekir. Örneğin, makine öğrenimi uzmanları Wikipedia'daki tüm İngilizce sayfalar gibi geniş bir metin veri kümesi üzerinde büyük bir dil modelini önceden eğitebilir. Ön eğitimin ardından ortaya çıkan model, aşağıdaki tekniklerden herhangi biri kullanılarak daha da hassaslaştırılabilir:

R

rotasyonel varyans

#image

Bir resim sınıflandırma probleminde, resmin yönü değişse bile algoritmanın resimleri başarıyla sınıflandırabilmesidir. Örneğin algoritma hâlâ bir tenis raketinin yukarı, yan veya aşağı yönlü olduğunu tespit edebilir. Dönel değişkenliğin her zaman istenmediğini unutmayın; örneğin, baş aşağı 9 değeri 9 olarak sınıflandırılmamalıdır.

Ayrıca çeviri değişmezliği ve boyut sabitliği konularına da bakın.

S

boyut sapması

#image

Bir resim sınıflandırma probleminde, resmin boyutu değişse bile algoritmanın resimleri başarıyla sınıflandırabilmesidir. Örneğin algoritma, bir kedinin 2 milyon piksel mi yoksa 200 bin piksel mi tükettiğini tespit edebilir. En iyi resim sınıflandırma algoritmalarının bile boyut sapması konusunda pratik sınırları olduğunu unutmayın. Örneğin, bir algoritmanın (veya insanların) yalnızca 20 piksel tüketen bir kedi resmini doğru bir şekilde sınıflandırma olasılığı düşüktür.

Ayrıca çeviri değişmezliği ve dönüştürme sabitliği konularına da bakın.

mekansal havuzlama

#image

Havuzu inceleyin.

stride

#image

Evrimsel işlemde veya havuzlamada, sonraki giriş dilim serisinin her bir boyutundaki delta. Örneğin, aşağıdaki animasyonda kıvrımlı bir işlem sırasında (1,1) adım gösterilmektedir. Bu nedenle, bir sonraki giriş dilimi, önceki giriş diliminin sağında bir konumdan başlar. İşlem sağ kenara ulaştığında, bir sonraki dilim tamamen solda ve bir konum aşağıdadır.

Bir 5x5 giriş matrisi ve 3x3 kıvrımlı filtre. Adım (1,1) olduğundan, 9 kez kıvrımlı bir filtre uygulanır. İlk kıvrımlı dilim, giriş matrisinin sol üstteki 3x3 alt matrisini değerlendirir. İkinci dilim, üst ortadaki 3x3 alt matrisi değerlendirir. Üçüncü kıvrımlı dilim, sağ üstteki 3x3 alt matrisi değerlendirir.  Dördüncü dilim, sol ortadaki 3x3 alt matrisi değerlendirir.
     Beşinci dilim ortadaki 3x3 alt matrisi değerlendirir. Altıncı dilim, sağ ortadaki 3x3 alt matrisi değerlendirir. Yedinci dilim, sol alttaki 3x3 alt matrisi değerlendirir.  Sekizinci dilim, alt-ortadaki 3x3 alt matrisi değerlendirir. Dokuzuncu dilim, sağ alttaki 3x3 alt matrisi değerlendirir.

Yukarıdaki örnek, iki boyutlu bir adımı göstermektedir. Giriş matrisi üç boyutluysa adım da üç boyutlu olur.

alt örnekleme

#image

Havuzu inceleyin.

T

sıcaklık

#language
#image
#generativeAI

Bir model çıkışının rastgelelik derecesini kontrol eden bir hiperparametre. Yüksek sıcaklıklar daha fazla rastgele çıkışla, düşük sıcaklıklar ise daha az rastgele çıkışla sonuçlanır.

En iyi sıcaklığın seçilmesi uygulamaya ve model çıktısının istenen özelliklerine bağlıdır. Örneğin, reklam öğesi çıktısı üreten bir uygulama oluştururken muhtemelen sıcaklığı yükseltirsiniz. Buna karşılık, modelin doğruluğunu ve tutarlılığını iyileştirmek için resimleri veya metni sınıflandıran bir model oluştururken muhtemelen sıcaklığı düşürürsünüz.

Sıcaklık genellikle softmax ile kullanılır.

çeviri değişimsizliği

#image

Bir resim sınıflandırma probleminde, bir algoritmanın resim içindeki nesnelerin konumu değişse bile görüntüleri başarılı bir şekilde sınıflandırma becerisi. Örneğin, algoritma ister çerçevenin ortasında ister karenin sol ucunda olsun, bir köpeği tanımlayabilir.

Boyut değişkenliği ve dönüştürme sabitliği konularını da inceleyin.