برچسب گذاری تصویر

با استفاده از APIهای برچسب‌گذاری تصویر ML Kit، می‌توانید اطلاعات مربوط به موجودیت‌های موجود در یک تصویر را در طیف وسیعی از دسته‌ها شناسایی و استخراج کنید. مدل پیش‌فرض برچسب‌گذاری تصویر می‌تواند اشیاء عمومی، مکان‌ها، فعالیت‌ها، گونه‌های جانوری، محصولات و موارد دیگر را شناسایی کند.

همچنین می‌توانید از یک مدل طبقه‌بندی تصویر سفارشی برای تطبیق تشخیص با یک مورد استفاده خاص استفاده کنید. برای اطلاعات بیشتر به استفاده از یک مدل LiteRT سفارشی مراجعه کنید.

قابلیت‌های کلیدی

  • یک طبقه‌بندی‌کننده پایه قدرتمند و همه‌منظوره که بیش از ۴۰۰ دسته را تشخیص می‌دهد که رایج‌ترین اشیاء یافت‌شده در عکس‌ها را توصیف می‌کنند.
  • با مدل‌های سفارشی، موارد استفاده خود را تنظیم کنید. از مدل‌های از پیش آموزش‌دیده دیگر از TensorFlow Hub یا مدل سفارشی خودتان که با TensorFlow، AutoML یا LiteRT آموزش دیده است، استفاده کنید.
  • رابط‌های برنامه‌نویسی سطح بالای آسان برای استفاده نیازی به درگیر شدن با ورودی/خروجی مدل سطح پایین، پیش‌پردازش و پس‌پردازش تصویر یا ساخت خط لوله پردازش نیست. کیت ML برچسب‌ها را از مدل LiteRT استخراج کرده و آنها را به عنوان توضیحات متنی ارائه می‌دهد.

توجه داشته باشید که این API برای مدل‌های طبقه‌بندی تصویر که کل تصویر را توصیف می‌کنند، در نظر گرفته شده است. برای طبقه‌بندی یک یا چند شیء در یک تصویر، مانند کفش یا قطعات مبلمان، API تشخیص و ردیابی شیء ممکن است مناسب‌تر باشد.

مدل‌های طبقه‌بندی تصویر پشتیبانی‌شده

APIهای برچسب‌گذاری تصویر از مدل‌های طبقه‌بندی تصویر مختلفی پشتیبانی می‌کنند:

مدل‌های طبقه‌بندی تصویر پشتیبانی‌شده
مدل پایه این API به طور پیش‌فرض از یک مدل برچسب‌گذاری تصویر قدرتمند و همه‌منظوره استفاده می‌کند که بیش از ۴۰۰ موجودیت را که رایج‌ترین مفاهیم موجود در عکس‌ها را پوشش می‌دهند، تشخیص می‌دهد.
مدل‌های سفارشی LiteRT برای هدف قرار دادن مفاهیم خاص برنامه، API مدل‌های طبقه‌بندی تصویر سفارشی را از طیف وسیعی از منابع می‌پذیرد. این مدل‌ها می‌توانند مدل‌های از پیش آموزش‌دیده دانلود شده از TensorFlow Hub یا مدل‌های خودتان باشند که با AutoML، LiteRT یا خود TensorFlow آموزش دیده‌اند. مدل‌ها را می‌توان با برنامه شما همراه کرد یا با Cloud Storage میزبانی و در زمان اجرا دانلود کرد.

با استفاده از مدل پایه

مدل پایه ML Kit فهرستی از موجودیت‌ها را برمی‌گرداند که افراد، اشیا، مکان‌ها، فعالیت‌ها و غیره را شناسایی می‌کنند. هر موجودیت دارای امتیازی است که نشان‌دهنده میزان اطمینان مدل ML به مرتبط بودن آن است. با این اطلاعات، می‌توانید کارهایی مانند تولید خودکار فراداده و تعدیل محتوا را انجام دهید. مدل پیش‌فرض ارائه شده با ML Kit بیش از ۴۰۰ موجودیت مختلف را تشخیص می‌دهد.

آی‌او‌اس اندروید

برچسب‌های نمونه

مدل پایه در API برچسب‌گذاری تصویر از بیش از ۴۰۰ برچسب پشتیبانی می‌کند، مانند مثال‌های زیر:

دسته بندی برچسب‌های نمونه
مردم Crowd
Selfie
Smile
فعالیت‌ها Dancing
Eating
Surfing
چیزها Car
Piano
Receipt
حیوانات Bird
Cat
Dog
گیاهان Flower
Fruit
Vegetable
مکان‌ها Beach
Lake
Mountain

نتایج مثال

در اینجا مثالی از موجودیت‌هایی که در عکس پیوست شناسایی شده‌اند، آورده شده است.

عکس: کلمنت بوکو-لشات / ویکی مدیا / CC BY-SA 3.0
برچسب 0
متن ورزشگاه
اعتماد به نفس ۰.۹۲۰۵۳۵۴
برچسب ۱
متن ورزش
اعتماد به نفس ۰.۷۵۳۱۱۰۹
برچسب ۲
متن رویداد
اعتماد به نفس ۰.۶۶۹۰۵۲۹۶
برچسب ۳
متن اوقات فراغت
اعتماد به نفس ۰.۵۹۹۰۴۱۴۶
برچسب ۴
متن فوتبال
اعتماد به نفس ۰.۵۶۳۸۴۵۳۴
برچسب ۵
متن خالص
اعتماد به نفس ۰.۵۴۶۷۹۱۸۵
برچسب ۶
متن گیاه
اعتماد به نفس ۰.۵۲۴۳۶۴

استفاده از یک مدل LiteRT سفارشی

مدل برچسب‌گذاری تصویر پایه ML Kit برای استفاده عمومی ساخته شده است. این مدل برای تشخیص ۴۰۰ دسته که رایج‌ترین اشیاء یافت شده در عکس‌ها را توصیف می‌کنند، آموزش دیده است. برنامه شما ممکن است به یک مدل طبقه‌بندی تصویر تخصصی نیاز داشته باشد که تعداد محدودتری از دسته‌ها را با جزئیات بیشتر تشخیص دهد، مانند مدلی که بین گونه‌های گل یا انواع غذا تمایز قائل شود.

این API با پشتیبانی از مدل‌های طبقه‌بندی تصویر سفارشی از طیف وسیعی از منابع، به شما امکان می‌دهد تا با یک مورد استفاده خاص، آن را سفارشی‌سازی کنید. برای کسب اطلاعات بیشتر به مدل‌های سفارشی با کیت ML مراجعه کنید. مدل‌های سفارشی را می‌توان با برنامه شما همراه کرد یا به صورت پویا از فضای ذخیره‌سازی ابری دانلود کرد.

آی‌او‌اس اندروید

پیش‌پردازش تصویر ورودی

در صورت نیاز، برچسب‌گذاری تصویر از مقیاس‌بندی و کشش دوخطی تصویر برای تنظیم اندازه تصویر ورودی و نسبت ابعاد آن استفاده می‌کند تا با الزامات مدل اصلی مطابقت داشته باشد.