Poz algılama

Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

ML Kit PoseDetect API, uygulama geliştiricilerin sürekli bir video veya statik görüntüden bir öznenin duruşunu gerçek zamanlı olarak algılamalarını sağlayan hafif bir çok yönlü çözümdür. Pozlama, iskeletin bir dizi önemli noktayla vücudun belirli bir anda konumunu belirtir. Önemli noktalar, omuzlar ve kalçalar gibi farklı vücut bölgelerine karşılık gelir. Önemli noktaların göreli konumları, bir duruşu birbirinden ayırt etmek için kullanılabilir.

iOS Android

ML Kit Pose Algılama, yüz simgesi (kulaklar, gözler, ağız ve burun) ile ellerin ve ayakların üzerinde toplanan noktaların yer aldığı 33 puanlık bir tam gövdeli iskelet eşleşmesi üretir. Aşağıdaki şekilde 1. şekilde, kullanıcının kamerasına bakan önemli noktalar gösterilmektedir. Bu nedenle ayna resimdir. Kullanıcının sağ tarafı resmin sol tarafında görünür:

Şekil 1. Yer işaretleri

ML Kit Poz Algılama, iyi sonuçlar alabilmek için özel bir ekipman veya makine öğrenimi uzmanlığı gerektirmez. Geliştiriciler bu teknolojiyle yalnızca birkaç satır kod ile kullanıcıları için benzersiz bir deneyim oluşturabilir.

Poz algılamak için kullanıcının yüzünün bulunması gerekir. Poz algılama, en iyi sonucu öznenin tüm vücudu karede göründüğünde çalışırken kısmi bir vücut duruşunu da algılar. Bu durumda, tanınmayan önemli noktalara görselin dışındaki koordinatlar atanır.

Temel özellikler

  • Platformlar arası destek Hem Android hem iOS'ta aynı deneyimi yaşayın.
  • Tam vücut takibi Model, el ve ayakların konumları da dahil olmak üzere 33 önemli iskelet nokta işareti döndürür.
  • InFrameLikelihood puanı: Her önemli nokta için, önemli noktanın resim çerçevesi içinde olma olasılığını gösteren bir ölçümdür. Puan 0,0 ile 1,0 arasında bir aralıktır. 1,0 değeri yüksek güvenilirlik olduğunu gösterir.
  • Optimize edilmiş iki SDK Temel SDK, Pixel 4 ve iPhone X gibi modern telefonlarda gerçek zamanlı olarak çalışır. Sonuç olarak, sırasıyla ~30 ve ~45 fps hızında sonuçlar döndürür. Ancak, önemli noktaların koordinatları farklı olabilir. Doğru SDK, sonuçları daha yavaş bir kare hızında döndürür ancak daha doğru koordinat değerleri sağlar.
  • Z Böylece, derinlik analizi için Koordinat: Bu değer, kullanıcının vücudunun belirli bölümlerinin kullanıcının önünde mi yoksa gerisinde mi olduğunun belirlenmesine yardımcı olabilir. Daha fazla bilgi için aşağıdaki Z Koordinatı bölümüne bakın.

Pose uygulamaları API'si, bir dizi önemli nokta ile konumlarını döndürmesi açısından Yüz Tanıma API'sine benzer. Ancak Yüz Algılama ayrıca gülümseyen ağız veya açık gözler gibi özellikleri tanımaya çalışır. Poz Algılama, duruştaki önemli noktalara ya da pozun kendisine herhangi bir anlam vermez. Bir duruşu yorumlamak için kendi algoritmalarınızı oluşturabilirsiniz. Bazı örnekler için Poz Sınıflandırma İpuçları bölümüne bakın.

Poz algılama, resimde yalnızca bir kişiyi algılayabilir. Resimde iki kişi yer alıyorsa model, en yüksek güvenliğe sahip olduğu tespit edilen kişiye önemli noktalar atar.

Z Koordinatı

Z Koordinatı, her önemli nokta için hesaplanan deneysel bir değerdir. "X" ve "koordinat" gibi "resim pikselleri" ile ölçülür ancak gerçek bir 3D değeri değildir. Z ekseni kameraya diktir ve öznenin kalçalarından geçirilir. Z ekseninin kaynağı, kalçalar arasındaki yaklaşık orta noktadır (kameraya göre sol/sağ ve ön/geri). Negatif Z değerleri kameraya doğrudur; pozitif değerler kameranın önündedir. Z koordinatının üst veya alt sınırı yok.

Örnek sonuçları

Aşağıdaki tabloda, sağdaki pozdaki birkaç önemli noktanın koordinatları ve InFrameLikelihood gösterilmektedir. Kullanıcının sol elinin Z koordinatı, öznenin kalçasının önünde ve kameranın karşısında olduğundan negatiftir.

Önemli noktaTürKonumKare İçi Benzerlik
11SOL_KAPATILDI(734,9671, 550.7924, -118.11934)0,9999038
12 SAĞ_KÜÇÜK (391,27032, 583.2485, -321.15836) 0,9999894
13 SOL_TANITICI (903,83704, 754.676, -219.67009) 0,9836427
14 SAĞ_ELBOW (322.18152, 842.5973, -179.28519) 0,99970156
15 SOL_YAZILIM (1073,8956, 654.9725, -820.93463) 0,9737737
16 SAĞ_YAZI (218.27956, 1015.70435, -683.6567) 0,995568
17 SÜRE_PINK (1146,1635, 609.6432, -956.9976) 0,95273364
18 SAĞ_PINK (176,17755, 1065,838, -776,5006) 0,9785348

Gelişmiş seçenekler

Bu API'nin temelindeki makine öğrenimi modelleri hakkında daha fazla bilgi için Google AI blog yayınımıza göz atın.

ML adalet uygulamalarımız ve modellerin nasıl eğitildiği hakkında daha fazla bilgi edinmek için Model Kartımıza göz atın