Bu sayfa Resim Modelleri sözlüğü terimlerini içerir. Tüm sözlük terimleri için burayı tıklayın.
CEVAP
artırılmış gerçeklik
Bilgisayarla oluşturulmuş bir görüntüyü kullanıcının gerçek dünya görüntüsünün üzerine bindirerek birleşik bir görünüm sağlayan teknoloji.
otomatik kodlayıcı
Girişten en önemli bilgileri çıkarmayı öğrenen bir sistem. Otomatik kodlayıcılar, kodlayıcı ve kod çözücü kombinasyonudur. Otomatik kodlayıcılar, aşağıdaki iki adımlı süreci kullanır:
- Kodlayıcı, girişi (tipik olarak) kayıplı, düşük boyutlu (orta) bir biçime eşler.
- Kod çözücü, düşük boyutlu biçimi orijinal daha yüksek boyutlu giriş biçimiyle eşleyerek orijinal girişin kayıplı bir sürümünü oluşturur.
Otomatik kodlayıcılar, kod çözücünün orijinal girişi kodlayıcının ara biçiminden mümkün olduğunca yakından yeniden oluşturmaya çalışmasını sağlayarak uçtan uca eğitilir. Ara biçim, orijinal biçimden daha küçük (düşük boyutlu) olduğundan, otomatik kodlayıcı, girişteki hangi bilgilerin gerekli olduğunu öğrenmeye zorlanır ve çıkış, girişle tamamen aynı olmaz.
Örneğin:
- Giriş verileri bir grafikse, tam olmayan kopya orijinal grafiğe benzer, ancak bir şekilde değiştirilmiş olur. Belki de tam olmayan kopya, orijinal grafikteki gürültüyü giderir veya bazı eksik pikselleri doldurur.
- Giriş verileri metinse otomatik kodlayıcı, orijinal metni taklit eden (ancak metinle aynı olmayan) yeni metin oluşturur.
Ayrıca çeşitli otomatik kodlayıcılar konusuna da bakın.
otomatik regresif model
Kendi önceki tahminlerine dayanarak bir tahminde bulunan model. Örneğin, otomatik regresif dil modelleri, önceden tahmin edilen jetonlara dayalı olarak bir sonraki jetonu tahmin eder. Tüm Transformer tabanlı büyük dil modelleri otomatik regresiftir.
Buna karşılık GAN tabanlı görüntü modelleri, görüntüleri aşamalı olarak değil, tek bir ileriye doğru geçişte oluşturdukları için genellikle otomatik regresif değildir. Ancak bazı görüntü oluşturma modelleri, birkaç adımda görüntü oluşturdukları için otomatik regresif olur.
B
sınırlayıcı kutu
Bir resimde, aşağıdaki resimde gösterilen köpek gibi, ilgilenilen bir alanın çevresindeki dikdörtgenin (x, y) koordinatları.
C
konvolüsyon
Matematikte, gündelik hayatta iki işlevin bir karışımıdır. Makine öğreniminde, bir kıvrım, ağırlıkları eğitmek için evrimsel filtre ile giriş matrisini karıştırır.
Makine öğrenimindeki "evrim" terimi, genellikle evrimsel işlem veya evrimsel katman terimlerinin kısaltılmış halidir.
Konvolüsyonlar olmadığında, makine öğrenimi algoritmasının büyük bir tensördeki her hücre için ayrı bir ağırlık öğrenmesi gerekir. Örneğin, 2.000 x 2.000 görüntüler üzerinde eğiten bir makine öğrenimi algoritmasının 4 milyon ayrı ağırlık bulması gerekir. Konvolüsyonlar sayesinde bir makine öğrenimi algoritmasının yalnızca evrimsel filtredeki her hücre için ağırlık bulması yeterli olur. Bu sayede, modeli eğitmek için gereken bellek önemli ölçüde azalır. Konvolüsyonel filtre uygulandığında, bu filtre hücreler arasında kopyalanarak her biri filtreyle çarpılır.
kıvrımlı filtre
Bir devrimsel operasyontaki iki oyuncudan biri. (Diğer aktör, giriş matrisinin bir dilimi.) Evrimsel filtre, giriş matrisiyle aynı sıralamaya sahip ancak daha küçük bir şekle sahip matristir. Örneğin, 28x28 boyutlarında bir giriş matrisi söz konusu olduğunda filtre, 28x28’den küçük herhangi bir 2D matris olabilir.
Fotoğrafik işlemede, kıvrımlı bir filtredeki tüm hücreler genellikle sabit birler ve sıfırlardan oluşan sabit bir desene ayarlanır. Makine öğreniminde, evrişimsel filtreler genellikle rastgele sayılarla başlatılır ve ardından ağ, ideal değerleri etirir.
kıvrımlı katman
İçinden bir giriş matrisi boyunca evrimsel filtrenin geçtiği derin nöral ağ katmanı. Örneğin, şu 3x3 evrimsel filtreyi ele alalım:
Aşağıdaki animasyon, 5x5 giriş matrisini içeren 9 evrimsel işlemden oluşan kıvrımlı bir katmanı göstermektedir. Her evrilerek yapılan işlemin, giriş matrisinin 3x3'lük farklı bir diliminde çalıştığına dikkat edin. Ortaya çıkan 3x3 matris (sağda), 9 evrimsel işlemin sonuçlarından oluşur:
konvolüsyonel nöral ağ
En az bir katmanın evrimsel katman olduğu bir nöral ağ. Tipik bir evrişimsel nöral ağ, aşağıdaki katmanların bir kombinasyonundan oluşur:
Evrimsel nöral ağlar, görüntü tanıma gibi belirli problemlerde büyük başarı elde etti.
kıvrımlı işlem
Aşağıdaki iki adımlı matematik işlemi:
- Dönüşümsel filtre ile bir giriş matrisi diliminin öğe bazında çarpımı. (Giriş matrisinin dilimi, kıvrımlı filtre ile aynı sıralamaya ve boyuta sahiptir.)
- Ortaya çıkan ürün matrisindeki tüm değerlerin toplamı.
Örneğin, aşağıdaki 5x5 giriş matrisini ele alalım:
Şimdi aşağıdaki 2x2 kıvrımlı filtreyi hayal edin:
Her kıvrımlı işlem, giriş matrisinin 2x2 boyutunda tek bir dilimini içerir. Örneğin, giriş matrisinin sol üst kısmında bulunan 2x2 boyutunda bir dilimi kullandığımızı varsayalım. Dolayısıyla, bu dilimdeki konvolüsyon işlemi aşağıdaki gibi görünür:
Evrimsel katman, her biri giriş matrisinin farklı bir dilimi üzerinde işlem yapan bir dizi kıvrımlı işlemden oluşur.
D
veri genişletme
Ek örnekler oluşturmak için mevcut örnekleri dönüştürüp eğitim örneklerinin kapsamını ve sayısını yapay olarak artırma. Örneğin, görüntülerin özelliklerinizden biri olduğunu ancak veri kümenizin, modelin faydalı ilişkilendirmeleri öğrenmesi için yeterli görüntü örneği içermediğini varsayalım. İdeal olarak, modelinizin düzgün şekilde eğitilmesi için veri kümenize yeterli miktarda etiketli görüntü eklemeniz gerekir. Bu mümkün değilse veri genişletme, orijinal resmin birçok varyantını oluşturmak için her resmi döndürebilir, uzatabilir ve yansıtabilir. Bu da, muhtemelen mükemmel bir eğitim için yeterli sayıda etiketli veri elde edilmesini sağlayabilir.
derinlemesine olarak ayrılabilir kıvrımlı nöral ağ (sepCNN)
Inception'ı temel alan ancak Inception modüllerinin derinlemesine ayrılabilen evrimlerle değiştirildiği bir evrimsel nöral ağ mimarisi. Xception olarak da bilinir.
Derinlemesine ayrılabilen konvolüsyon (ayrılabilir konvolüs olarak da kısaltılır), standart bir 3 boyutlu evrimi, daha hesaplama açısından daha verimli olan iki ayrı evrim işlemeye dönüştürür: Birincisi, derinliği 1 olan derinlikli kıvrım ({0}uzunluk ve genişlik 1, nokta genişliğinde x ve kıvrım 1) ve ikincisi, hesaplama açısından daha verimli olan iki ayrı evrim işlemesi.
Daha fazla bilgi edinmek için Xception: Depthwise Reparable Conolutions (Derinlemesine Ayrılabilir Dönüşümlerle Derin Öğrenme) konusuna bakın.
aşağı örnekleme
Aşağıdaki durumlardan biri anlamına gelebilecek aşırı yüklenmiş terim:
- Bir modeli daha verimli şekilde eğitmek için bir özellikteki bilgi miktarını azaltma. Örneğin, bir görüntü tanıma modelini eğitmeden önce, yüksek çözünürlüklü resimlerden daha düşük çözünürlüklü bir biçime aşağı örnekleme işlemi uygulanabilir.
- Yeterince temsil edilmeyen sınıflarda model eğitimini iyileştirmek için, yeterince temsil edilmeyen sınıf örneklerinin orantısız bir şekilde düşük yüzdesiyle ilgili eğitim. Örneğin, sınıf dengesiz bir veri kümesinde modeller, çoğunluk sınıfı hakkında çok fazla bilgi edinme eğilimi gösterirken azınlık sınıfı hakkında yeterli bilgi edinmez. Aşağı örnekleme, çoğunluk ve azınlık sınıflarıyla ilgili eğitim miktarını dengelemeye yardımcı olur.
F
ince ayar
Önceden eğitilmiş bir modelde gerçekleştirilen göreve özel ikinci bir eğitim geçişi, modelin parametrelerini belirli bir kullanım alanına göre hassaslaştırıyor. Örneğin, bazı büyük dil modelleri için tam eğitim sırası aşağıdaki gibidir:
- Ön eğitim: Tüm İngilizce Wikipedia sayfaları gibi geniş bir genel veri kümesiyle büyük bir dil modelini eğitin.
- Hassas ayarlama: Önceden eğitilmiş modeli, tıbbi sorgulara yanıt verme gibi belirli bir görevi gerçekleştirecek şekilde eğitin. İnce ayarlar genellikle belirli bir göreve odaklanan yüz veya binlerce örnek içerir.
Başka bir örnek olarak, büyük bir resim modeli için tam eğitim sırası aşağıdaki gibidir:
- Ön eğitim: Wikimedia Commons'taki tüm resimler gibi büyük bir genel resim veri kümesinde büyük bir resim modelini eğitin.
- Hassas ayarlama: Önceden eğitilmiş modeli, orkaların görüntülerini oluşturma gibi belirli bir görevi gerçekleştirecek şekilde eğitin.
Hassas ayarlamalar yapmak için aşağıdaki stratejilerin herhangi bir kombinasyonu gerekebilir:
- Önceden eğitilmiş modelin mevcut parametrelerinin tümünü değiştirme. Buna bazen tam ince ayar denir.
- Önceden eğitilmiş modelin mevcut parametrelerinin yalnızca bazılarını (genellikle çıkış katmanına en yakın katmanlar) değiştirirken diğer mevcut parametreleri değiştirmeden (tipik olarak, katmanlar giriş katmanına en yakın olan katmanlar) değiştirilir. Parametre etkili ayarlama bölümünü inceleyin.
- Genellikle çıkış katmanına en yakın mevcut katmanların üzerine daha fazla katman ekleme.
İnce ayar, bir öğrenme aktarma biçimidir. Bu nedenle, ince ayarda, önceden eğitilmiş modeli eğitmek için kullanılanlardan farklı bir kayıp işlevi veya farklı bir model türü kullanılabilir. Örneğin, giriş görüntüsündeki kuş sayısını döndüren bir regresyon modeli oluşturmak için, önceden eğitilmiş bir büyük görüntü modelinde ince ayar yapabilirsiniz.
İnce ayarları aşağıdaki terimlerle karşılaştırın:
G
üretken yapay zeka
Resmi tanımı olmayan, dönüştürücü bir alan. Bununla birlikte, çoğu uzman, üretici yapay zeka modellerinin aşağıdakilerin tümüne sahip içerikler oluşturabileceği ("üretim") konusunda hemfikirdir:
- karmaşık
- tutarlı
- orijinal
Örneğin, üretken yapay zeka modeli karmaşık makaleler ve görüntüler oluşturabilir.
LSTM ve RNN'ler gibi önceki bazı teknolojiler de orijinal ve tutarlı içerikler oluşturabilir. Bazı uzmanlar bu eski teknolojileri üretken yapay zeka olarak görürken diğerleri gerçek üretici yapay zekanın, önceki teknolojilerin üretebileceğinden daha karmaşık çıkışlar gerektirdiğini düşünüyor.
Tahmine dayalı makine öğrenimi ile kontrast oluşturun.
İ
resim tanıma
Bir görseldeki nesneleri, desenleri veya kavramları sınıflandıran işlem. Görüntü tanıma, görüntü sınıflandırma olarak da bilinir.
Daha fazla bilgi için ML Pratikumu: Görüntü Sınıflandırma sayfasını inceleyin.
birleşim üzerinde kesişim (IoU)
İki kümenin kesişiminin birleşimine bölümü. Makine öğrenimi görüntü algılama görevlerinde IoU, modelin tahmin edilen sınırlayıcı kutusunun kesin referans sınırlayıcı kutusuna göre doğruluğunu ölçmek için kullanılır. Bu durumda, iki kutunun IoU'su çakışan alan ile toplam alan arasındaki orandır ve değeri 0 (tahmini sınırlayıcı kutu ile kesin referans kutucuğu çakışması yok) 1 ile 1 (tahmini sınırlayıcı kutu ve kesin referans kutucuğu aynı koordinatlara sahiptir) arasında değişir.
Örneğin, aşağıdaki resimde:
- Tahmin edilen sınırlayıcı kutu (modelin, resimdeki gece masasının konumunu tahmin ettiği konumu sınırlayan koordinatlar) mor renkle gösterilir.
- Kesin referans sınırlayıcı kutu (resimdeki gece masasının gerçekte nerede bulunduğunu sınırlayan koordinatlar) yeşil renkle belirtilmiştir.
Burada, tahmin ve kesin referans için sınırlayıcı kutuların (soldan altta) kesişimi 1'dir. Tahmin ile kesin referans için sınırlayıcı kutuların birleşimi (sağ altta) 7'dir. Dolayısıyla IoU \(\frac{1}{7}\)'dir.


K
önemli noktalar
Bir resimdeki belirli özelliklerin koordinatları. Örneğin, çiçek türlerini ayırt eden bir görüntü tanıma modeli için anahtar noktalar her bir taç yaprağının merkezi, sap, erkeğin merkezi vb. olabilir.
L
önemli noktalar
Anahtar noktaların eş anlamlısı.
M
MNIST
LeCun, Cortes ve Burges tarafından derlenen, herkese açık bir veri kümesi olan ve her biri, bir insanın 0-9 arasındaki belirli bir basamağı nasıl manuel olarak yazdığını gösteren 60.000 görüntü içeriyor. Her görüntü, 28x28'lik bir tam sayı dizisi olarak depolanır. Burada her tam sayı, 0 ile 255 arasında (0 ve 255 dahil) gri tonlamalı bir değerdir.
MNIST, genellikle yeni makine öğrenimi yaklaşımlarını test etmek için kullanılan standart bir makine öğrenimi veri kümesidir. Ayrıntılı bilgi için MNIST El Yazısı Rakamları Veritabanı'na göz atın.
P
havuz
Daha önceki bir evrimsel katman tarafından oluşturulan bir matrisin (veya matrislerin) daha küçük bir matrise indirgenmesi. Havuz işlemi genellikle havuz alanındaki maksimum veya ortalama değerin alınmasını içerir. Örneğin, aşağıdaki 3x3 matrisin olduğunu varsayalım:
Havuzlama işlemi, tıpkı kıvrımlı işlemlerde olduğu gibi bu matrisi dilimlere böler ve ardından bu kıvrımlı işlemi adımlar halinde kaydırır. Örneğin, havuzlama işleminin kıvrımlı matrisi 1x1 adımlarla 2x2 dilimlere böldüğünü varsayalım. Aşağıdaki diyagramda gösterildiği gibi, dört havuz oluşturma işlemi gerçekleşir. Her havuzlama işleminin bu dilimdeki dört maksimum değeri seçtiğini düşünün:
Havuzlama, giriş matrisinde çeviri sabitliğinin uygulanmasına yardımcı olur.
Görüntü uygulamaları için havuzlama, daha resmi olarak uzamsal havuzlama olarak bilinir. Zaman serisi uygulamalarında, genellikle havuzlama, geçici havuzlama olarak adlandırılır. Daha resmi olmayan şekilde, havuzlamaya genellikle alt örnekleme veya aşağı örnekleme denir.
önceden eğitilmiş model
Eğitilmiş modeller veya model bileşenleri (yerleştirme vektör gibi). Bazen, önceden eğitilmiş yerleştirilmiş vektörleri bir nöral ağa feedlersiniz. Diğer durumlarda, modeliniz önceden eğitilmiş yerleştirmelere bağlı kalmak yerine yerleştirme vektörlerini eğitir.
Önceden eğitilmiş dil modeli terimi, eğitim öncesi süreçlerden geçmiş büyük bir dil modelini ifade eder.
ön eğitim
Büyük bir veri kümesi üzerinde bir modelin ilk eğitimi. Bazı önceden eğitilmiş modeller sakar devlerdir ve genellikle ek eğitimlerle iyileştirilmesi gerekir. Örneğin, makine öğrenimi uzmanları Wikipedia'daki tüm İngilizce sayfalar gibi geniş bir metin veri kümesi üzerinde büyük bir dil modelini önceden eğitebilir. Ön eğitimin ardından ortaya çıkan model, aşağıdaki tekniklerden herhangi biri kullanılarak daha da hassaslaştırılabilir:
R
rotasyonel varyans
Bir resim sınıflandırma probleminde, resmin yönü değişse bile algoritmanın resimleri başarıyla sınıflandırabilmesidir. Örneğin algoritma hâlâ bir tenis raketinin yukarı, yan veya aşağı yönlü olduğunu tespit edebilir. Dönel değişkenliğin her zaman istenmediğini unutmayın; örneğin, baş aşağı 9 değeri 9 olarak sınıflandırılmamalıdır.
Ayrıca çeviri değişmezliği ve boyut sabitliği konularına da bakın.
S
boyut sapması
Bir resim sınıflandırma probleminde, resmin boyutu değişse bile algoritmanın resimleri başarıyla sınıflandırabilmesidir. Örneğin algoritma, bir kedinin 2 milyon piksel mi yoksa 200 bin piksel mi tükettiğini tespit edebilir. En iyi resim sınıflandırma algoritmalarının bile boyut sapması konusunda pratik sınırları olduğunu unutmayın. Örneğin, bir algoritmanın (veya insanların) yalnızca 20 piksel tüketen bir kedi resmini doğru bir şekilde sınıflandırma olasılığı düşüktür.
Ayrıca çeviri değişmezliği ve dönüştürme sabitliği konularına da bakın.
mekansal havuzlama
Havuzu inceleyin.
stride
Evrimsel işlemde veya havuzlamada, sonraki giriş dilim serisinin her bir boyutundaki delta. Örneğin, aşağıdaki animasyonda kıvrımlı bir işlem sırasında (1,1) adım gösterilmektedir. Bu nedenle, bir sonraki giriş dilimi, önceki giriş diliminin sağında bir konumdan başlar. İşlem sağ kenara ulaştığında, bir sonraki dilim tamamen solda ve bir konum aşağıdadır.
Yukarıdaki örnek, iki boyutlu bir adımı göstermektedir. Giriş matrisi üç boyutluysa adım da üç boyutlu olur.
alt örnekleme
Havuzu inceleyin.
T
sıcaklık
Bir model çıkışının rastgelelik derecesini kontrol eden bir hiperparametre. Yüksek sıcaklıklar daha fazla rastgele çıkışla, düşük sıcaklıklar ise daha az rastgele çıkışla sonuçlanır.
En iyi sıcaklığın seçilmesi uygulamaya ve model çıktısının istenen özelliklerine bağlıdır. Örneğin, reklam öğesi çıktısı üreten bir uygulama oluştururken muhtemelen sıcaklığı yükseltirsiniz. Buna karşılık, modelin doğruluğunu ve tutarlılığını iyileştirmek için resimleri veya metni sınıflandıran bir model oluştururken muhtemelen sıcaklığı düşürürsünüz.
Sıcaklık genellikle softmax ile kullanılır.
çeviri değişimsizliği
Bir resim sınıflandırma probleminde, bir algoritmanın resim içindeki nesnelerin konumu değişse bile görüntüleri başarılı bir şekilde sınıflandırma becerisi. Örneğin, algoritma ister çerçevenin ortasında ister karenin sol ucunda olsun, bir köpeği tanımlayabilir.
Boyut değişkenliği ve dönüştürme sabitliği konularını da inceleyin.