Makine Öğrenimi Sözlüğü: Görüntü Modelleri

Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

Bu sayfa, Resim Modelleri sözlüğü terimlerini içerir. Tüm sözlük terimleri için burayı tıklayın.

A

artırılmış gerçeklik

#image

Kullanıcıların oluşturduğu görüntüye bilgisayar tarafından oluşturulan bir resmin üzerine bindiren ve böylece birleşik bir görünüm sağlayan teknoloji.

B

sınırlayıcı kutu

#image

Bir resimde, (x, y) aşağıdaki resimde bulunan köpek gibi, ilgili bir alanın etrafındaki dikdörtgenin koordinatlarıdır.

Kanepede oturan köpek fotoğrafı. Sol üstteki (275, 1271) koordinatları ve sağ alttaki (2954, 2761) koordinatlarıyla yeşil bir sınırlayıcı kutu, köpeğin gövdesini inceliyor

C

evrim

#image

Matematikte, basitçe ifade etmek gerekirse iki işlev bir aradadır. Makine öğreniminde, ağırlıkları eğitmek için eğitici filtreyi ve giriş matrisini karıştırır.

Makine öğreniminde " Evrişim" terimi, genellikle evrimsel işleme veya evrimsel katmana atıfta bulunmanın kısa bir yoludur.

Çevrimler olmadan, makine öğrenimi algoritmasının büyük bir tenser içindeki her hücre için ayrı bir ağırlık öğrenmesi gerekir. Örneğin 2K x 2K görüntüler üzerinde bir makine öğrenimi algoritması eğitimi, 4 milyon ayrı ağırlık bulmak için zorlanır. Evrişimler sayesinde makine öğrenimi algoritmasının yalnızca eğilim dönüşümü filtresindeki her hücrenin ağırlığını bulması gerekir. Bu da modeli eğitmek için gereken belleği önemli ölçüde azaltır. Evrişimli filtre uygulandığında, her bir hücrenin filtreyle çarpılacağı şekilde hücreler genelinde çoğaltılır.

kıvrımlı filtre

#image

Evrim sürecinde iki eylemden biri. (Diğer aktör bir giriş matrisinin dilimidir.) Evrişim filtresi, giriş matrisiyle aynı sıralamaya sahip ancak daha küçük bir şekle sahip bir matristir. Örneğin, 28x28 boyutlu bir giriş matrisi için filtre, 28x28 boyutundan küçük herhangi bir 2D matrisi olabilir.

Fotoğraf manipülasyonunda, kıvrımlı bir filtredeki tüm hücreler genellikle sabit bir hücre ve sıfırlardan oluşan bir kalıpa ayarlanır. Makine öğreniminde, konfigürasyon filtreleri genellikle rastgele sayılarla başlatılır ve daha sonra ağ, ideal değerleri eğitir.

kıvrımlı katman

#image

Giriş matrisinin boyunca evrimsel filtrenin geçtiği bir derin nöral ağın katmanı. Örneğin, aşağıdaki 3x3 evrimi filtresini göz önünde bulundurun:

Şu değerlere sahip bir 3x3 matrisi: [[0,1,0], [1,0,1], [0,1,0]]

Aşağıdaki animasyon, 5x5 giriş matrisini içeren 9 evrişimli işlemden oluşan kıvrımlı bir katmanı göstermektedir. Her kıvrımlı işlemin, giriş matrisinin farklı bir 3x3 dilimi üzerinde çalıştığına dikkat edin. Sonuçta elde edilen 3x3 matris (sağ tarafta) 9 evrimsel işlemin sonucundan oluşur:

İki matrisi gösteren animasyon. İlk matris 5x5 matrisidir: [[128,97,53,201,198], [35,22,25,200,195],
 [37,24,28,197,179,179,179,179,179
          İkinci matris 3x3 matrisidir:
          [[181,303,618], [115,338,605], [169,351,560]].
          İkinci matris, 5x5 matrisinin farklı 3x3 alt kümelerinde eğilim filtresi [[0, 1, 0], [1, 0, 1], [0, 1, 0]] uygulanarak hesaplanır.

evrişimli nöral ağ

#image

En az bir katmanın evrimsel katman olduğu bir nöral ağ. Tipik bir evrimsel nöral ağ, aşağıdaki katmanların bir kombinasyonundan oluşur:

Evrişimli nöral ağlar, görüntü tanıma gibi bazı problemlerde oldukça başarılı olmuştur.

kıvrımlı operasyon

#image

Aşağıdaki iki adımlı matematik işlemi:

  1. Eğri filtresinin ve bir giriş matrisinin bir diliminin öğe odaklı çarpımı. (Giriş matrisinin dilimi, kıvrımlı filtreyle aynı sıralamaya ve boyuta sahiptir.)
  2. Sonuç ürün matrisindeki tüm değerlerin toplamı.

Örneğin, aşağıdaki 5x5 giriş matrisini göz önünde bulundurun:

5x5 matrisi: [[128,97,53,201,198], [35,22,25,200,195],
          [37,24,28,197,182], [33,28,92,195,179], [118]

Şimdi, aşağıdaki 2x2 konfigürasyon filtresini ele alalım:

2x2 matris: [[1, 0], [0, 1]]

Evrişimli her işlemde, giriş matrisinin tek bir 2x2 dilimi bulunur. Örneğin, giriş matrisinin sol üst kısmındaki 2x2 dilimi kullandığımızı varsayalım. Bu nedenle, bu dilimdeki evrişleme işlemi şu şekilde görünür:

Giriş matrisinin sol üst 2x2 bölümüne ([[128,97], [35,22]]) kıvrımlı filtre [[1, 0], [0, 1]] uygulanıyor.
          Evrişim filtresi 128 ve 22'yi olduğu gibi bırakır ancak 97 ve 35'i sıfırlar. Sonuç olarak evriş işlemi 150 (128+22) değerini verir.

Evrimsel katman, her biri giriş matrisinin farklı bir dilimi üzerinde işlem yapan bir dizi kıvrımlı işlemden oluşur.

G

veri genişletme

#image

Ek örnekler oluşturmak için mevcut örnekleri dönüştürerek eğitim örneklerinin aralığını ve sayısını yapay olarak artırın. Örneğin, resim özelliklerinizden biridir. Ancak veri kümeniz, modelin faydalı ilişkilendirmeler öğrenmesi için yeterli resim örneği içermez. İdeal olarak, modelinizin düzgün bir şekilde eğitilmesini sağlamak için veri kümenize yeterli sayıda etiketli resim eklemeniz gerekir. Bu mümkün değilse veri toplama, orijinal resmin birçok varyantını oluşturmak için her bir resmi döndürebilir, esnetebilir ve yansıtabilir. Böylece, muhtemelen mükemmel bir eğitim için yeterli etiketli veri elde edilir.

derinden ayrılabilen evrişimli nöral ağ (sepCNN)

#image

Evrişimli nöral ağ Inception ile başlayan, Inception modüllerinin derinlikle ayrılabilir birbiriyle değiştirildiği bir mimaridir. Xception olarak da bilinir.

Derinle ayrılır, ayrılabilir evrim (ayrılabilir evrim olarak da bilinir), standart 3D evrimi, hesaplama açısından daha verimli olan iki ayrı kıvrım evresine böler: öncelikle 1 derinliği olan derinleşme evresi, ikincisi, uzunluk 1'e doğru gelişen 1. derinlikte bir kıvrım.

Daha fazla bilgi için Xception: Derin Ayrılabilir Çarpışmalarla Derin Öğrenme konusuna bakın.

aşağı örnekleme

#image

Aşağıdakilerden herhangi biri anlamına gelen aşırı yüklenen terim:

  • Modelin daha verimli şekilde eğitilmesi için özellikteki bilgi miktarını azaltmak. Örneğin, bir resim tanıma modelini eğitmeden önce, yüksek çözünürlüklü resimleri daha düşük çözünürlüklü bir biçimde örnekleme.
  • Yeterince temsil edilmeyen sınıflardaki model eğitimini iyileştirmek için aşırı temsil edilen sınıf örneklerinin orantısız bir şekilde düşük yüzdesiyle ilgili eğitim. Örneğin, sınıf dengesiz bir veri kümesinde modeller, büyüklük sınıfı hakkında çok fazla bilgi edinme eğilimindedir ancak azınlık sınıfı hakkında yeterli bilgi sahibi değildir. Aşağı örnekleme, çoğunluk ve azınlık sınıfları için eğitim miktarının dengelenmesine yardımcı olur.

I

resim tanıma

#image

Bir resimdeki nesneleri, desenleri veya kavramları sınıflandıran bir işlem. Görüntü tanıma, resim sınıflandırması olarak da bilinir.

Daha fazla bilgi için ML Pratiği: Görüntü Sınıflandırma bölümüne bakın.

Birlik üzerinden kesişim (IoU)

#image

İki kümenin birleşiminin birlik sayısına bölünmesiyle elde edilir. Makine öğrenimi görüntü algılama görevlerinde IoU, modelin tahmin edilen sınırlayıcı kutusunun kesin referans sınırlayıcı kutusuyla ilgili olarak doğruluk düzeyini ölçmek için kullanılır. Bu durumda, iki kutu için IoU, çakışan alan ile toplam alan arasındaki orandır ve değerinin 0 (tahmini sınırlayıcı kutuyla kesin referans sınırı kutusuyla çakışma yok) - 1 (tahmin edilen sınırlayıcı kutu ve kesin referans sınırlayıcı kutusu) tam olarak aynı koordinatları içerir) arasında değişir.

Örneğin, aşağıdaki resimde:

  • Öngörülen sınırlayıcı kutu (modelin resimdeki gece tablosunu göreceği yeri sınırlayan koordinatlar) mor renkle belirtilmiştir.
  • Kesin referans numarasını belirten kutu (resimde gece tablosunun bulunduğu yeri sınırlayan koordinatlar) yeşil renktedir.

Arles'deki Van Gogh'un resmi ve Yatağın Yatak Odasındaki yatak odasının yanında, komodin çevresinde iki farklı sınırlayıcı kutu bulunur. Kesin referans numarasını gösteren kutu (yeşil) gece masasını mükemmel bir şekilde yazar. Tahmin edilen sınırlayıcı kutunun (mor renkli) kesin referans çizgi kutusunun% 50 aşağısı ve sağında yer alır. Gece tablosunun sağ alt çeyreğini kapsar, ancak tablonun geri kalanını kaçırır.

Burada, tahmin ve kesin referans için sınırlayıcı kutuların (sol altında) kesişimi 1'dir. Tahmin ve kesin doğruluk için sınırlayıcı kutuların birleşimi (sağın altında) 7'dir. Dolayısıyla IoU \(\frac{1}{7}\)şeklindedir.

Yukarıdakiyle aynı resim, ancak her sınırlayıcı kutu dört çeyreğe bölünür. Kesin referans kutusu kutusunun sağ alt çeyreği ve tahmin edilen sınırlayıcı kutunun sol üst çemberi birbiriyle çakıştığından toplam yedi çeyreğe sahip. Bu çakışan bölüm (yeşil renkte vurgulanmıştır) kesişimi temsil etmektedir ve 1 alan içerir. Yukarıdakiyle aynı resim, ancak her sınırlayıcı kutu dört çeyreğe bölünür. Kesin referans kutusu kutusunun sağ alt çeyreği ve tahmin edilen sınırlayıcı kutunun sol üst çemberi birbiriyle çakıştığından toplam yedi çeyreğe sahip.
          İki sınırlayıcı kutunun içinde yer alan iç kısmın tamamı (yeşil renkte vurgulanmıştır) birleşimi temsil eder ve 7 alan içerir.

K

önemli noktalar

#image

Bir resimdeki belirli özelliklerin koordinatları. Örneğin, çiçek türlerini birbirinden ayıran bir resim tanıma modeli için önemli noktalar, her bir tacı, kökü, dayanıklılığı vb. merkezi olabilir.

L

önemli noktalar

#image

Önemli noktalar ile eş anlamlı.

A

MNIST

#image

LeCun, Cortes ve Burges tarafından derlenen ve 60.000 görüntü içeren, her bir görüntünün 0-9 arasındaki belirli bir basamağı manuel olarak nasıl yazdığını gösteren bir kamu alanı veri kümesi. Her resim, 28x28'lik bir tam sayı dizisi olarak depolanır. Her tam sayı, 0 ile 255 arasında (ikisi de dahil) gri tonlu bir değerdir.

MNIST, makine öğrenimi için standart bir veri kümesidir ve genellikle yeni makine öğrenimi yaklaşımlarını test etmek için kullanılır. Ayrıntılar için El Yazısı Rakamların MNIST Veritabanı'nı inceleyin.

P

havuz

#image

Önceki bir evrimsel katman tarafından oluşturulan matrisi (veya matrisi) daha küçük bir matrisin azaltma. Havuz genellikle havuz alanı boyunca maksimum veya ortalama değeri elde etmeyi içerir. Örneğin, aşağıdaki 3x3 matriye sahip olduğumuzu varsayalım:

3x3 matrisi [[5,3,1], [8,2,5], [9,4,3]].

Havuz işleri gibi, evrimsel bir işlem gibi, bu matrisi parçalara ayırır ve bu kıvrımlı işlemi ilerlemelerle kaydırır. Örneğin, havuz oluşturma evresinin, evrişim matrisini 1x1 adımla 2x2 dilimlere böldüğünü varsayalım. Aşağıdaki şemada gösterildiği gibi, dört havuz işlemi gerçekleştirilir. Her havuz oluşturma işleminin bu dilimdeki maksimum dört değerini seçtiğini varsayalım:

Giriş matrisi, şu değerlerle 3x3'tür: [[5,3,1], [8,2,5], [9,4,3]].
          Giriş matrisinin sol üst 2x2 alt matrisi [[5,3], [8,2]] olduğundan sol üst havuz işlemi 8 değerini elde eder (maksimum 5, 3, 8 ve 2). Giriş matrisinin sağ üst 2x2 alt matrisi [[3,1], [2,5]] olduğundan sağ üst havuzlama işlemi 5 değerini verir. Giriş matrisinin sol alt 2x2 alt matrisi [[8,2], [9,4]] olduğundan sol alt havuz işlemi 9 değerini verir.  Giriş matrisinin sağ alt 2x2 alt matrisi [[2,5], [4,3]] olduğundan sağ alt havuz işlemi 5 değerini verir.  Özetle, havuz işlemi 2x2 matrisi [[8,5], [9,5]] verir.

Havuz oluşturma, giriş matrisinde çeviri sapmasını zorunlu kılmaya yardımcı olur.

Göz sağlığı uygulamaları için havuz oluşturma, daha resmi olarak uzamsal havuz olarak bilinir. Zaman serisi uygulamaları genellikle havuzlamayı geçici havuzlama olarak adlandırır. Daha resmi olarak havuz oluşturma, genellikle alt örnekleme veya aşağı örnekleme olarak adlandırılır.

K

dönme değişimi

#image

Resim sınıflandırma sorununda algoritma, resmin yönü değişse bile resimleri başarıyla sınıflandırabilir. Örneğin, algoritma bir tenis raketini yukarı, yan veya aşağıyı göstermeye devam ederek tanımlayabilir. Rotasyon değişiminin her zaman istendiği gibi olmadığını unutmayın. Örneğin, ters 9, 9 olarak sınıflandırılmamalıdır.

Ayrıca, çeviri sapması ve boyut sabitliği bölümlerini de inceleyin.

C

boyut değişimi

#image

Bir görsel sınıflandırma sorununda algoritma, resmin boyutu değişse bile resimleri başarılı bir şekilde sınıflandırabilir. Örneğin, algoritma 2 milyon veya 200 bin piksel kullanıp kullanmadığını kontrol edebilir. En iyi resim sınıflandırma algoritmalarının bile boyut değişikliğiyle ilgili pratik sınırlar olduğunu unutmayın. Örneğin, bir algoritmanın (veya insanın) yalnızca 20 piksel tüketen bir kedi resmini doğru şekilde sınıflandırması olası değildir.

Ayrıca, çeviri değişimi ve dönüştürme değişimi başlıklı makaleyi de inceleyin.

uzamsal havuz

#image

Havuz konusunu inceleyin.

stride

#image

Evrişimli bir çalışmada veya bir havuz oluşturma işleminde, bir sonraki dilim serisinin her boyutunun deltası. Örneğin, aşağıdaki animasyon evrimsel bir işlem sırasında bir (1,1) temposunu göstermektedir. Bu nedenle, sonraki giriş dilimi önceki giriş diliminin sağında bir konumda başlar. İşlem sağ kenara ulaştığında, bir sonraki dilimin en sola olacağı ancak bir konum aşağı geleceği anlamına gelir.

Giriş için 5x5 matrisi ve 3x3 kıvrımlı filtre. Adım (1,1) olduğundan, 9 kez evrişim filtresi uygulanır. İlk kıvrımlı dilim, giriş matrisinin sol üst kısmındaki 3x3 alt matrisi değerlendirir. İkinci bölüm, üst ortadaki 3x3 alt matrisi değerlendirir. Üçüncü konfigürasyon dilim, sağ üstteki 3x3 alt matrisi değerlendirir.  Dördüncü dilim, orta sol 3x3 alt matrisi değerlendirir.
     Beşinci dilim orta 3x3 alt matrisi değerlendirir. Altıncı dilim, orta sağ 3x3 alt matrisi değerlendirir. Yedinci dilim, sol alt 3x3 alt matrisi değerlendirir.  Sekizinci dilim, alt ortadaki 3x3 alt matrisi değerlendirir. Dokuzuncu dilim, sağ alttaki 3x3 alt matrisi değerlendirir.

Yukarıdaki örnekte iki boyutlu bir adım gösterilmektedir. Giriş matrisi üç boyutluysa adım da üç boyutlu olur.

alt örnekleme

#image

Havuz konusunu inceleyin.

T

çeviri değişimi

#image

Resim sınıflandırma probleminde bir algoritma, nesnelerin resim içindeki konumu değişse bile resimleri başarıyla sınıflandırabilir. Örneğin, algoritma ister çerçevenin ortasında ister çerçevenin sol ucunda olsun bir köpeği tanımlayabilir.

Ayrıca boyut sabitliği ve rotasyon sapması