Nesne algılama ve izleme

ML Kit'in cihaz üzerinde algılama ve izleme API'si ile bir görüntü veya canlı kamera feed'indeki nesneleri algılayıp takip edebilirsiniz.

İsteğe bağlı olarak, API'de bulunan yaklaşık sınıflandırıcıyı veya kendi özel görüntü sınıflandırma modelinizi kullanarak algılanan nesneleri sınıflandırabilirsiniz. Daha fazla bilgi için Özel TensorFlow Lite modeli kullanma bölümüne bakın.

Nesne algılama ve izleme, cihazda gerçekleştiği için görsel arama ardışık düzeninin ön ucu olarak daha iyi çalışır. Nesneleri algılayıp filtreledikten sonra bunları Cloud Vision Product Search gibi bir bulut arka ucuna aktarabilirsiniz.

iOS Android

Temel özellikler

  • Nesne algılama ve izleme Nesneleri algılayıp konumlarını belirleyin. Birbirini izleyen resim çerçevelerindeki nesneleri izleyin.
  • Optimize edilmiş cihaz modeli Nesne algılama ve izleme modeli mobil cihazlar için optimize edilmiştir ve daha düşük teknolojili cihazlarda bile gerçek zamanlı uygulamalarda kullanılmak üzere tasarlanmıştır.
  • Belirgin nesne algılama Bir görüntüdeki en belirgin nesneyi otomatik olarak belirler.
  • Genel sınıflandırma Nesneleri ilgilenmediğiniz nesneleri filtrelemek için kullanabileceğiniz geniş kategoriler halinde sınıflandırın. Şu kategoriler desteklenir: ev eşyaları, moda ürünleri, yiyecekler, bitkiler ve yerler.
  • Özel modelle sınıflandırma Belirli nesne kategorilerini tanımlamak veya filtrelemek için kendi özel görüntü sınıflandırma modelinizi kullanın. Görüntünün arka planını boş bırakarak özel modelinizin daha iyi performans göstermesini sağlayın.

Örnek sonuçlar

Resimler arasında en belirgin nesneyi izleme

Aşağıdaki örnekte, ML Kit tarafından sağlanan varsayılan genel sınıflandırıcı ile birbirini izleyen üç çerçeveden izleme verileri gösterilmektedir.

İzleme Kimliği 0
Sınırlar (95, 45), (496, 45), (496, 240), (95, 240)
Kategori YER
Sınıflandırma güveni 0,9296875
İzleme Kimliği 0
Sınırlar (84, 46), (478, 46), (478, 247), (84, 247)
Kategori YER
Sınıflandırma güveni 0,8710938
İzleme Kimliği 0
Sınırlar (53, 45), (519, 45), (519, 240), (53, 240)
Kategori YER
Sınıflandırma güveni 0,8828125

Fotoğraf: Christian Ferrer [CC BY-SA 4.0]

Statik resimdeki birden çok nesne

Aşağıdaki örnekte, ML Kit tarafından sağlanan varsayılan genel sınıflandırıcıyla resimde tespit edilen dört nesnenin verileri gösterilmektedir.

Nesne 0
Sınırlar (1, 97), (332, 97), (332, 332), (1, 332)
Kategori FASHION_İYİ
Sınıflandırma güveni 0,95703125
1. Nesne
Sınırlar (186, 80), (337, 80), (337, 226), (186, 226)
Kategori FASHION_İYİ
Sınıflandırma güveni 0,84375
Nesne 2
Sınırlar (296, 80), (472, 80), (472, 388), (296, 388)
Kategori FASHION_İYİ
Sınıflandırma güveni 0,94921875
Nesne 3
Sınırlar (439, 83), (615, 83), (615, 306), (439, 306)
Kategori FASHION_İYİ
Sınıflandırma güveni 0,9375

Özel TensorFlow Lite modeli kullanma

Varsayılan kaba sınıflandırıcı beş kategori için oluşturulmuştur ve algılanan nesneler hakkında sınırlı bilgi sağlar. Daha dar bir kavram alanını ayrıntılı şekilde ele alan daha özel bir sınıflandırıcı modeline ihtiyacınız olabilir. Örneğin, çiçek türlerini veya yiyecek türlerini birbirinden ayırt etmek için bir model kullanabilirsiniz.

Bu API, çok çeşitli kaynaklardan özel görüntü sınıflandırma modellerini destekleyerek belirli bir kullanım alanına göre uyarlama yapmanıza olanak tanır. Daha fazla bilgi edinmek için lütfen ML Kiti ile özel modeller sayfasına göz atın. Özel modeller, uygulamanızla birlikte paket haline getirilebilir veya Firebase Machine Learning'in Model dağıtım hizmeti aracılığıyla buluttan dinamik olarak indirilebilir.

iOS Android

Giriş resmini önceden işleme

Nesne algılama ve izleme, gerekirse giriş resmi boyutunu ve en boy oranını temel modelin gereksinimlerine uyacak şekilde ayarlamak için çift yönlü resim ölçeklendirme ve genişletme kullanır.