با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

برچسب گذاری تصویر

با APIهای برچسب‌گذاری تصویر ML Kit می‌توانید اطلاعات موجودات موجود در یک تصویر را در گروه گسترده‌ای از دسته‌ها شناسایی و استخراج کنید. مدل برچسب‌گذاری تصویر پیش‌فرض می‌تواند اشیاء عمومی، مکان‌ها، فعالیت‌ها، گونه‌های جانوری، محصولات و موارد دیگر را شناسایی کند.

همچنین می‌توانید از یک مدل طبقه‌بندی تصویر سفارشی برای تنظیم تشخیص به یک مورد خاص استفاده کنید. برای اطلاعات بیشتر به استفاده از یک مدل سفارشی TensorFlow Lite مراجعه کنید.

قابلیت های کلیدی

  • یک طبقه‌بندی‌کننده پایه همه منظوره قدرتمند بیش از 400 دسته را تشخیص می‌دهد که متداول‌ترین اشیا را در عکس‌ها توصیف می‌کنند.
  • با استفاده از مدل‌های سفارشی، از مدل‌های از پیش آموزش‌دیده دیگر TensorFlow Hub یا مدل سفارشی خود که با TensorFlow، AutoML Vision Edge یا TensorFlow Lite Model سازنده آموزش دیده‌اند، استفاده کنید.
  • APIهای سطح بالا با کاربری آسان، نیازی به پرداختن به ورودی/خروجی مدل سطح پایین، پردازش تصویر قبل و بعد، یا ساخت خط لوله پردازش نیست. ML Kit برچسب ها را از مدل TensorFlow Lite استخراج می کند و آنها را به عنوان توضیحات متنی ارائه می دهد.

توجه داشته باشید که این API برای مدل های طبقه بندی تصویر که تصویر کامل را توصیف می کنند در نظر گرفته شده است. برای طبقه‌بندی یک یا چند شیء در یک تصویر، مانند کفش‌ها یا تکه‌های مبلمان، API تشخیص و ردیابی شیء ممکن است مناسب‌تر باشد.

مدل های طبقه بندی تصویر پشتیبانی شده

Image Labeling API از مدل های مختلف طبقه بندی تصویر پشتیبانی می کند:

مدل های طبقه بندی تصویر پشتیبانی شده
مدل پایه API به طور پیش‌فرض از یک مدل برچسب‌گذاری تصویر همه منظوره قدرتمند استفاده می‌کند که بیش از 400 موجودیت را شناسایی می‌کند که متداول‌ترین مفاهیم در عکس‌ها را پوشش می‌دهند.
مدل های سفارشی TensorFlow Lite برای هدف قرار دادن مفاهیم خاص برنامه، API مدل های طبقه بندی تصویر سفارشی را از طیف گسترده ای از منابع می پذیرد. اینها می توانند مدل های از پیش آموزش دیده دانلود شده از TensorFlow Hub یا مدل های خودتان باشند که با AutoML Vision Edge، TensorFlow Lite Model Maker یا خود TensorFlow آموزش دیده اند. مدل‌ها را می‌توان با برنامه شما همراه کرد یا با Firebase Machine Learning میزبانی کرد و در زمان اجرا دانلود کرد.

با استفاده از مدل پایه

مدل پایه ML Kit فهرستی از موجودیت هایی را برمی گرداند که افراد، اشیا، مکان ها، فعالیت ها و غیره را شناسایی می کنند. هر موجودیت دارای امتیازی است که نشان دهنده اطمینان مدل ML به ارتباط آن است. با این اطلاعات می توانید کارهایی مانند تولید خودکار ابرداده و تعدیل محتوا را انجام دهید. مدل پیش فرض ارائه شده با کیت ML بیش از 400 موجودیت مختلف را شناسایی می کند.

iOS اندروید

برچسب های نمونه

مدل پایه در API برچسب‌گذاری تصویر از بیش از 400 برچسب پشتیبانی می‌کند، مانند مثال‌های زیر:

دسته بندی برچسب های نمونه
مردم Crowd
Selfie
Smile
فعالیت ها Dancing
Eating
Surfing
چیزها Car
Piano
Receipt
حیوانات Bird
Cat
Dog
گیاهان Flower
Fruit
Vegetable
مکان ها Beach
Lake
Mountain

نتایج نمونه

در اینجا نمونه ای از موجودیت هایی است که در عکس همراه شناسایی شده اند.

عکس: کلمنت بوکو-لشات / ویکی مدیا / CC BY-SA 3.0
برچسب 0
متن استادیوم
اعتماد به نفس 0.9205354
برچسب 1
متن ورزش ها
اعتماد به نفس 0.7531109
برچسب 2
متن رویداد
اعتماد به نفس 0.66905296
برچسب 3
متن اوقات فراغت
اعتماد به نفس 0.59904146
برچسب 4
متن فوتبال
اعتماد به نفس 0.56384534
برچسب 5
متن خالص
اعتماد به نفس 0.54679185
برچسب 6
متن گیاه
اعتماد به نفس 0.524364

با استفاده از یک مدل سفارشی TensorFlow Lite

مدل برچسب‌گذاری تصویر پایه کیت ML برای استفاده عمومی ساخته شده است. این آموزش برای تشخیص 400 دسته که رایج ترین اشیاء یافت شده را در عکس ها توصیف می کنند، آموزش دیده است. برنامه شما ممکن است به یک مدل طبقه‌بندی تصویر تخصصی نیاز داشته باشد که تعداد محدودتری از دسته‌ها را با جزئیات بیشتر تشخیص دهد، مانند مدلی که بین گونه‌های گل یا انواع غذا تمایز قائل شود.

این API به شما امکان می‌دهد با پشتیبانی از مدل‌های طبقه‌بندی تصویر سفارشی از طیف گسترده‌ای از منابع، برای یک مورد خاص استفاده کنید. لطفاً برای کسب اطلاعات بیشتر به مدل های سفارشی با کیت ML مراجعه کنید. با استفاده از سرویس استقرار مدل Firebase Machine Learning، می‌توان مدل‌های سفارشی را با برنامه‌تان همراه کرد یا به‌صورت پویا از ابر دانلود کرد.

iOS اندروید

پیش پردازش تصویر ورودی

در صورت نیاز، Image Labeling از مقیاس بندی و کشش تصویر دوخطی برای تنظیم اندازه تصویر ورودی و نسبت ابعاد استفاده می کند تا مطابق با الزامات مدل اصلی باشد.