Bu sayfa, Resim Modelleri sözlüğü terimlerini içerir. Tüm sözlük terimleri için burayı tıklayın.
A
artırılmış gerçeklik
Kullanıcıların oluşturduğu görüntüye bilgisayar tarafından oluşturulan bir resmin üzerine bindiren ve böylece birleşik bir görünüm sağlayan teknoloji.
B
sınırlayıcı kutu
Bir resimde, (x, y) aşağıdaki resimde bulunan köpek gibi, ilgili bir alanın etrafındaki dikdörtgenin koordinatlarıdır.
C
evrim
Matematikte, basitçe ifade etmek gerekirse iki işlev bir aradadır. Makine öğreniminde, ağırlıkları eğitmek için eğitici filtreyi ve giriş matrisini karıştırır.
Makine öğreniminde " Evrişim" terimi, genellikle evrimsel işleme veya evrimsel katmana atıfta bulunmanın kısa bir yoludur.
Çevrimler olmadan, makine öğrenimi algoritmasının büyük bir tenser içindeki her hücre için ayrı bir ağırlık öğrenmesi gerekir. Örneğin 2K x 2K görüntüler üzerinde bir makine öğrenimi algoritması eğitimi, 4 milyon ayrı ağırlık bulmak için zorlanır. Evrişimler sayesinde makine öğrenimi algoritmasının yalnızca eğilim dönüşümü filtresindeki her hücrenin ağırlığını bulması gerekir. Bu da modeli eğitmek için gereken belleği önemli ölçüde azaltır. Evrişimli filtre uygulandığında, her bir hücrenin filtreyle çarpılacağı şekilde hücreler genelinde çoğaltılır.
kıvrımlı filtre
Evrim sürecinde iki eylemden biri. (Diğer aktör bir giriş matrisinin dilimidir.) Evrişim filtresi, giriş matrisiyle aynı sıralamaya sahip ancak daha küçük bir şekle sahip bir matristir. Örneğin, 28x28 boyutlu bir giriş matrisi için filtre, 28x28 boyutundan küçük herhangi bir 2D matrisi olabilir.
Fotoğraf manipülasyonunda, kıvrımlı bir filtredeki tüm hücreler genellikle sabit bir hücre ve sıfırlardan oluşan bir kalıpa ayarlanır. Makine öğreniminde, konfigürasyon filtreleri genellikle rastgele sayılarla başlatılır ve daha sonra ağ, ideal değerleri eğitir.
kıvrımlı katman
Giriş matrisinin boyunca evrimsel filtrenin geçtiği bir derin nöral ağın katmanı. Örneğin, aşağıdaki 3x3 evrimi filtresini göz önünde bulundurun:
Aşağıdaki animasyon, 5x5 giriş matrisini içeren 9 evrişimli işlemden oluşan kıvrımlı bir katmanı göstermektedir. Her kıvrımlı işlemin, giriş matrisinin farklı bir 3x3 dilimi üzerinde çalıştığına dikkat edin. Sonuçta elde edilen 3x3 matris (sağ tarafta) 9 evrimsel işlemin sonucundan oluşur:
evrişimli nöral ağ
En az bir katmanın evrimsel katman olduğu bir nöral ağ. Tipik bir evrimsel nöral ağ, aşağıdaki katmanların bir kombinasyonundan oluşur:
Evrişimli nöral ağlar, görüntü tanıma gibi bazı problemlerde oldukça başarılı olmuştur.
kıvrımlı operasyon
Aşağıdaki iki adımlı matematik işlemi:
- Eğri filtresinin ve bir giriş matrisinin bir diliminin öğe odaklı çarpımı. (Giriş matrisinin dilimi, kıvrımlı filtreyle aynı sıralamaya ve boyuta sahiptir.)
- Sonuç ürün matrisindeki tüm değerlerin toplamı.
Örneğin, aşağıdaki 5x5 giriş matrisini göz önünde bulundurun:
Şimdi, aşağıdaki 2x2 konfigürasyon filtresini ele alalım:
Evrişimli her işlemde, giriş matrisinin tek bir 2x2 dilimi bulunur. Örneğin, giriş matrisinin sol üst kısmındaki 2x2 dilimi kullandığımızı varsayalım. Bu nedenle, bu dilimdeki evrişleme işlemi şu şekilde görünür:
Evrimsel katman, her biri giriş matrisinin farklı bir dilimi üzerinde işlem yapan bir dizi kıvrımlı işlemden oluşur.
G
veri genişletme
Ek örnekler oluşturmak için mevcut örnekleri dönüştürerek eğitim örneklerinin aralığını ve sayısını yapay olarak artırın. Örneğin, resim özelliklerinizden biridir. Ancak veri kümeniz, modelin faydalı ilişkilendirmeler öğrenmesi için yeterli resim örneği içermez. İdeal olarak, modelinizin düzgün bir şekilde eğitilmesini sağlamak için veri kümenize yeterli sayıda etiketli resim eklemeniz gerekir. Bu mümkün değilse veri toplama, orijinal resmin birçok varyantını oluşturmak için her bir resmi döndürebilir, esnetebilir ve yansıtabilir. Böylece, muhtemelen mükemmel bir eğitim için yeterli etiketli veri elde edilir.
derinden ayrılabilen evrişimli nöral ağ (sepCNN)
Evrişimli nöral ağ Inception ile başlayan, Inception modüllerinin derinlikle ayrılabilir birbiriyle değiştirildiği bir mimaridir. Xception olarak da bilinir.
Derinle ayrılır, ayrılabilir evrim (ayrılabilir evrim olarak da bilinir), standart 3D evrimi, hesaplama açısından daha verimli olan iki ayrı kıvrım evresine böler: öncelikle 1 derinliği olan derinleşme evresi, ikincisi, uzunluk 1'e doğru gelişen 1. derinlikte bir kıvrım.
Daha fazla bilgi için Xception: Derin Ayrılabilir Çarpışmalarla Derin Öğrenme konusuna bakın.
aşağı örnekleme
Aşağıdakilerden herhangi biri anlamına gelen aşırı yüklenen terim:
- Modelin daha verimli şekilde eğitilmesi için özellikteki bilgi miktarını azaltmak. Örneğin, bir resim tanıma modelini eğitmeden önce, yüksek çözünürlüklü resimleri daha düşük çözünürlüklü bir biçimde örnekleme.
- Yeterince temsil edilmeyen sınıflardaki model eğitimini iyileştirmek için aşırı temsil edilen sınıf örneklerinin orantısız bir şekilde düşük yüzdesiyle ilgili eğitim. Örneğin, sınıf dengesiz bir veri kümesinde modeller, büyüklük sınıfı hakkında çok fazla bilgi edinme eğilimindedir ancak azınlık sınıfı hakkında yeterli bilgi sahibi değildir. Aşağı örnekleme, çoğunluk ve azınlık sınıfları için eğitim miktarının dengelenmesine yardımcı olur.
I
resim tanıma
Bir resimdeki nesneleri, desenleri veya kavramları sınıflandıran bir işlem. Görüntü tanıma, resim sınıflandırması olarak da bilinir.
Daha fazla bilgi için ML Pratiği: Görüntü Sınıflandırma bölümüne bakın.
Birlik üzerinden kesişim (IoU)
İki kümenin birleşiminin birlik sayısına bölünmesiyle elde edilir. Makine öğrenimi görüntü algılama görevlerinde IoU, modelin tahmin edilen sınırlayıcı kutusunun kesin referans sınırlayıcı kutusuyla ilgili olarak doğruluk düzeyini ölçmek için kullanılır. Bu durumda, iki kutu için IoU, çakışan alan ile toplam alan arasındaki orandır ve değerinin 0 (tahmini sınırlayıcı kutuyla kesin referans sınırı kutusuyla çakışma yok) - 1 (tahmin edilen sınırlayıcı kutu ve kesin referans sınırlayıcı kutusu) tam olarak aynı koordinatları içerir) arasında değişir.
Örneğin, aşağıdaki resimde:
- Öngörülen sınırlayıcı kutu (modelin resimdeki gece tablosunu göreceği yeri sınırlayan koordinatlar) mor renkle belirtilmiştir.
- Kesin referans numarasını belirten kutu (resimde gece tablosunun bulunduğu yeri sınırlayan koordinatlar) yeşil renktedir.
Burada, tahmin ve kesin referans için sınırlayıcı kutuların (sol altında) kesişimi 1'dir. Tahmin ve kesin doğruluk için sınırlayıcı kutuların birleşimi (sağın altında) 7'dir. Dolayısıyla IoU \(\frac{1}{7}\)şeklindedir.


K
önemli noktalar
Bir resimdeki belirli özelliklerin koordinatları. Örneğin, çiçek türlerini birbirinden ayıran bir resim tanıma modeli için önemli noktalar, her bir tacı, kökü, dayanıklılığı vb. merkezi olabilir.
L
önemli noktalar
Önemli noktalar ile eş anlamlı.
A
MNIST
LeCun, Cortes ve Burges tarafından derlenen ve 60.000 görüntü içeren, her bir görüntünün 0-9 arasındaki belirli bir basamağı manuel olarak nasıl yazdığını gösteren bir kamu alanı veri kümesi. Her resim, 28x28'lik bir tam sayı dizisi olarak depolanır. Her tam sayı, 0 ile 255 arasında (ikisi de dahil) gri tonlu bir değerdir.
MNIST, makine öğrenimi için standart bir veri kümesidir ve genellikle yeni makine öğrenimi yaklaşımlarını test etmek için kullanılır. Ayrıntılar için El Yazısı Rakamların MNIST Veritabanı'nı inceleyin.
P
havuz
Önceki bir evrimsel katman tarafından oluşturulan matrisi (veya matrisi) daha küçük bir matrisin azaltma. Havuz genellikle havuz alanı boyunca maksimum veya ortalama değeri elde etmeyi içerir. Örneğin, aşağıdaki 3x3 matriye sahip olduğumuzu varsayalım:
Havuz işleri gibi, evrimsel bir işlem gibi, bu matrisi parçalara ayırır ve bu kıvrımlı işlemi ilerlemelerle kaydırır. Örneğin, havuz oluşturma evresinin, evrişim matrisini 1x1 adımla 2x2 dilimlere böldüğünü varsayalım. Aşağıdaki şemada gösterildiği gibi, dört havuz işlemi gerçekleştirilir. Her havuz oluşturma işleminin bu dilimdeki maksimum dört değerini seçtiğini varsayalım:
Havuz oluşturma, giriş matrisinde çeviri sapmasını zorunlu kılmaya yardımcı olur.
Göz sağlığı uygulamaları için havuz oluşturma, daha resmi olarak uzamsal havuz olarak bilinir. Zaman serisi uygulamaları genellikle havuzlamayı geçici havuzlama olarak adlandırır. Daha resmi olarak havuz oluşturma, genellikle alt örnekleme veya aşağı örnekleme olarak adlandırılır.
K
dönme değişimi
Resim sınıflandırma sorununda algoritma, resmin yönü değişse bile resimleri başarıyla sınıflandırabilir. Örneğin, algoritma bir tenis raketini yukarı, yan veya aşağıyı göstermeye devam ederek tanımlayabilir. Rotasyon değişiminin her zaman istendiği gibi olmadığını unutmayın. Örneğin, ters 9, 9 olarak sınıflandırılmamalıdır.
Ayrıca, çeviri sapması ve boyut sabitliği bölümlerini de inceleyin.
C
boyut değişimi
Bir görsel sınıflandırma sorununda algoritma, resmin boyutu değişse bile resimleri başarılı bir şekilde sınıflandırabilir. Örneğin, algoritma 2 milyon veya 200 bin piksel kullanıp kullanmadığını kontrol edebilir. En iyi resim sınıflandırma algoritmalarının bile boyut değişikliğiyle ilgili pratik sınırlar olduğunu unutmayın. Örneğin, bir algoritmanın (veya insanın) yalnızca 20 piksel tüketen bir kedi resmini doğru şekilde sınıflandırması olası değildir.
Ayrıca, çeviri değişimi ve dönüştürme değişimi başlıklı makaleyi de inceleyin.
uzamsal havuz
Havuz konusunu inceleyin.
stride
Evrişimli bir çalışmada veya bir havuz oluşturma işleminde, bir sonraki dilim serisinin her boyutunun deltası. Örneğin, aşağıdaki animasyon evrimsel bir işlem sırasında bir (1,1) temposunu göstermektedir. Bu nedenle, sonraki giriş dilimi önceki giriş diliminin sağında bir konumda başlar. İşlem sağ kenara ulaştığında, bir sonraki dilimin en sola olacağı ancak bir konum aşağı geleceği anlamına gelir.
Yukarıdaki örnekte iki boyutlu bir adım gösterilmektedir. Giriş matrisi üç boyutluysa adım da üç boyutlu olur.
alt örnekleme
Havuz konusunu inceleyin.
T
çeviri değişimi
Resim sınıflandırma probleminde bir algoritma, nesnelerin resim içindeki konumu değişse bile resimleri başarıyla sınıflandırabilir. Örneğin, algoritma ister çerçevenin ortasında ister çerçevenin sol ucunda olsun bir köpeği tanımlayabilir.
Ayrıca boyut sabitliği ve rotasyon sapması