تصنيف المواضيع

إنّ واجهة برمجة التطبيقات الخاصة بتصنيف المواضيع في أدوات تعلّم الآلة تسمح للمطورين بفصل مواضيع متعددة بسهولة عن الخلفية في الصورة، ما يتيح حالات الاستخدام مثل إنشاء الملصقات أو تبديل الخلفية أو إضافة تأثيرات رائعة إلى المواضيع.

يتم تعريف الأجسام على أنّها أبرز الأشخاص أو الحيوانات الأليفة أو العناصر الظاهرة في مقدّمة الصورة. إذا كان هناك شخصان متقاربان جدًا أو ملامسان لبعضهما البعض، يتم اعتبارهما موضوعًا واحدًا.

تأخذ واجهة برمجة التطبيقات لتقسيم المواضيع صورة إدخال وتنشئ قناع إخراج أو صورة نقطية في المقدمة. كما أنه يوفر قناعًا وصورة نقطية لكل شخص من الأشخاص الذين تم اكتشافهم (المقدمة تساوي جميع الموضوعات مجتمعة).

بشكل افتراضي، يكون قناع المقدمة والصورة النقطية للمقدمة بنفس حجم صورة الإدخال (من المحتمل أن يختلف حجم قناع كل موضوع وصورة نقطية عن حجم الصورة المدخلة). يتم تخصيص رقم عائم لكل بكسل من القناع يتراوح نطاقه بين 0.0 و1.0. كلما اقترب الرقم من 1.0، زادت الثقة في أن البكسل يمثل موضوعًا، والعكس صحيح.

يبلغ متوسط وقت الاستجابة الذي تم قياسه على هاتف Pixel 7 Pro 200 ملي ثانية تقريبًا. تتوافق واجهة برمجة التطبيقات هذه حاليًا مع الصور الثابتة فقط.

Android

الإمكانات الرئيسية

  • التصنيف متعدد المواضيع: يوفر هذا الخيار أقنعة وصورًا نقطية لكل موضوع على حدة، بدلاً من توفير قناع واحد وصورة نقطية واحدة لجميع المواضيع مجتمعةً.
  • التعرّف على الأشياء: الأجسام التي يتم التعرّف عليها هي الأشياء والحيوانات الأليفة والبشر.
  • المعالجة على الجهاز فقط: يتم إجراء كل عمليات المعالجة على الجهاز، مع الحفاظ على خصوصية المستخدم وبدون الحاجة إلى الاتصال بالشبكة.

أمثلة النتائج

إدخال صورة إخراج الصورة + القناع