
با استفاده از APIهای برچسبگذاری تصویر ML Kit، میتوانید اطلاعات مربوط به موجودیتهای موجود در یک تصویر را در طیف وسیعی از دستهها شناسایی و استخراج کنید. مدل پیشفرض برچسبگذاری تصویر میتواند اشیاء عمومی، مکانها، فعالیتها، گونههای جانوری، محصولات و موارد دیگر را شناسایی کند.
همچنین میتوانید از یک مدل طبقهبندی تصویر سفارشی برای تطبیق تشخیص با یک مورد استفاده خاص استفاده کنید. برای اطلاعات بیشتر به استفاده از یک مدل LiteRT سفارشی مراجعه کنید.
قابلیتهای کلیدی
- یک طبقهبندیکننده پایه قدرتمند و همهمنظوره که بیش از ۴۰۰ دسته را تشخیص میدهد که رایجترین اشیاء یافتشده در عکسها را توصیف میکنند.
- با مدلهای سفارشی، موارد استفاده خود را تنظیم کنید. از مدلهای از پیش آموزشدیده دیگر از TensorFlow Hub یا مدل سفارشی خودتان که با TensorFlow، AutoML یا LiteRT آموزش دیده است، استفاده کنید.
- رابطهای برنامهنویسی سطح بالای آسان برای استفاده نیازی به درگیر شدن با ورودی/خروجی مدل سطح پایین، پیشپردازش و پسپردازش تصویر یا ساخت خط لوله پردازش نیست. کیت ML برچسبها را از مدل LiteRT استخراج کرده و آنها را به عنوان توضیحات متنی ارائه میدهد.
توجه داشته باشید که این API برای مدلهای طبقهبندی تصویر که کل تصویر را توصیف میکنند، در نظر گرفته شده است. برای طبقهبندی یک یا چند شیء در یک تصویر، مانند کفش یا قطعات مبلمان، API تشخیص و ردیابی شیء ممکن است مناسبتر باشد.
مدلهای طبقهبندی تصویر پشتیبانیشده
APIهای برچسبگذاری تصویر از مدلهای طبقهبندی تصویر مختلفی پشتیبانی میکنند:
| مدلهای طبقهبندی تصویر پشتیبانیشده | |
|---|---|
| مدل پایه | این API به طور پیشفرض از یک مدل برچسبگذاری تصویر قدرتمند و همهمنظوره استفاده میکند که بیش از ۴۰۰ موجودیت را که رایجترین مفاهیم موجود در عکسها را پوشش میدهند، تشخیص میدهد. |
| مدلهای سفارشی LiteRT | برای هدف قرار دادن مفاهیم خاص برنامه، API مدلهای طبقهبندی تصویر سفارشی را از طیف وسیعی از منابع میپذیرد. این مدلها میتوانند مدلهای از پیش آموزشدیده دانلود شده از TensorFlow Hub یا مدلهای خودتان باشند که با AutoML، LiteRT یا خود TensorFlow آموزش دیدهاند. مدلها را میتوان با برنامه شما همراه کرد یا با Cloud Storage میزبانی و در زمان اجرا دانلود کرد. |
با استفاده از مدل پایه
مدل پایه ML Kit فهرستی از موجودیتها را برمیگرداند که افراد، اشیا، مکانها، فعالیتها و غیره را شناسایی میکنند. هر موجودیت دارای امتیازی است که نشاندهنده میزان اطمینان مدل ML به مرتبط بودن آن است. با این اطلاعات، میتوانید کارهایی مانند تولید خودکار فراداده و تعدیل محتوا را انجام دهید. مدل پیشفرض ارائه شده با ML Kit بیش از ۴۰۰ موجودیت مختلف را تشخیص میدهد.
برچسبهای نمونه
مدل پایه در API برچسبگذاری تصویر از بیش از ۴۰۰ برچسب پشتیبانی میکند، مانند مثالهای زیر:
| دسته بندی | برچسبهای نمونه |
|---|---|
| مردم | CrowdSelfieSmile |
| فعالیتها | DancingEatingSurfing |
| چیزها | CarPianoReceipt |
| حیوانات | BirdCatDog |
| گیاهان | FlowerFruitVegetable |
| مکانها | BeachLakeMountain |
نتایج مثال
در اینجا مثالی از موجودیتهایی که در عکس پیوست شناسایی شدهاند، آورده شده است.

| برچسب 0 | |
|---|---|
| متن | ورزشگاه |
| اعتماد به نفس | ۰.۹۲۰۵۳۵۴ |
| برچسب ۱ | |
| متن | ورزش |
| اعتماد به نفس | ۰.۷۵۳۱۱۰۹ |
| برچسب ۲ | |
| متن | رویداد |
| اعتماد به نفس | ۰.۶۶۹۰۵۲۹۶ |
| برچسب ۳ | |
| متن | اوقات فراغت |
| اعتماد به نفس | ۰.۵۹۹۰۴۱۴۶ |
| برچسب ۴ | |
| متن | فوتبال |
| اعتماد به نفس | ۰.۵۶۳۸۴۵۳۴ |
| برچسب ۵ | |
| متن | خالص |
| اعتماد به نفس | ۰.۵۴۶۷۹۱۸۵ |
| برچسب ۶ | |
| متن | گیاه |
| اعتماد به نفس | ۰.۵۲۴۳۶۴ |
استفاده از یک مدل LiteRT سفارشی
مدل برچسبگذاری تصویر پایه ML Kit برای استفاده عمومی ساخته شده است. این مدل برای تشخیص ۴۰۰ دسته که رایجترین اشیاء یافت شده در عکسها را توصیف میکنند، آموزش دیده است. برنامه شما ممکن است به یک مدل طبقهبندی تصویر تخصصی نیاز داشته باشد که تعداد محدودتری از دستهها را با جزئیات بیشتر تشخیص دهد، مانند مدلی که بین گونههای گل یا انواع غذا تمایز قائل شود.
این API با پشتیبانی از مدلهای طبقهبندی تصویر سفارشی از طیف وسیعی از منابع، به شما امکان میدهد تا با یک مورد استفاده خاص، آن را سفارشیسازی کنید. برای کسب اطلاعات بیشتر به مدلهای سفارشی با کیت ML مراجعه کنید. مدلهای سفارشی را میتوان با برنامه شما همراه کرد یا به صورت پویا از فضای ذخیرهسازی ابری دانلود کرد.
پیشپردازش تصویر ورودی
در صورت نیاز، برچسبگذاری تصویر از مقیاسبندی و کشش دوخطی تصویر برای تنظیم اندازه تصویر ورودی و نسبت ابعاد آن استفاده میکند تا با الزامات مدل اصلی مطابقت داشته باشد.