С API-интерфейсом обнаружения и отслеживания объектов ML Kit на устройстве вы можете обнаруживать и отслеживать объекты на изображении или в прямом эфире с камеры.
При желании вы можете классифицировать обнаруженные объекты либо с помощью грубого классификатора, встроенного в API, либо с помощью собственной пользовательской модели классификации изображений. Дополнительные сведения см. в разделе Использование пользовательской модели TensorFlow Lite .
Поскольку обнаружение и отслеживание объектов происходит на устройстве, оно хорошо работает в качестве внешнего интерфейса конвейера визуального поиска. После того как вы обнаружите и отфильтруете объекты, вы можете передать их в облачную серверную часть, например в Cloud Vision Product Search .
Ключевые возможности
- Быстрое обнаружение и отслеживание объектов. Обнаруживайте объекты и определяйте их местоположение на изображении. Отслеживайте объекты в последовательных кадрах изображения.
- Оптимизированная модель на устройстве Модель обнаружения и отслеживания объектов оптимизирована для мобильных устройств и предназначена для использования в приложениях реального времени даже на устройствах более низкого уровня.
- Обнаружение заметных объектов Автоматическое определение самого заметного объекта на изображении.
- Грубая классификация Классифицируйте объекты по широким категориям, которые можно использовать для фильтрации объектов, которые вам не интересны. Поддерживаются следующие категории: товары для дома, модные товары, продукты питания, растения и места.
- Классификация с помощью пользовательской модели Используйте собственную пользовательскую модель классификации изображений для определения или фильтрации определенных категорий объектов. Улучшите работу пользовательской модели, исключив фон изображения.
Пример результатов
Отслеживание самого заметного объекта на изображениях
В приведенном ниже примере показаны данные отслеживания из трех последовательных кадров с грубым классификатором по умолчанию, предоставленным ML Kit.
![]() |
| ||||||||
![]() |
| ||||||||
![]() |
|
Фото: Кристиан Феррер [CC BY-SA 4.0]
Несколько объектов на статичном изображении
В приведенном ниже примере показаны данные для четырех объектов, обнаруженных на изображении, с грубым классификатором по умолчанию, предоставленным ML Kit.
Объект 0 | |
---|---|
Границы | (1, 97), (332, 97), (332, 332), (1, 332) |
Категория | МОДА_ХОРОШО |
Достоверность классификации | 0,95703125 |
Объект 1 | |
Границы | (186, 80), (337, 80), (337, 226), (186, 226) |
Категория | МОДА_ХОРОШО |
Достоверность классификации | 0,84375 |
Объект 2 | |
Границы | (296, 80), (472, 80), (472, 388), (296, 388) |
Категория | МОДА_ХОРОШО |
Достоверность классификации | 0,94921875 |
Объект 3 | |
Границы | (439, 83), (615, 83), (615, 306), (439, 306) |
Категория | МОДА_ХОРОШО |
Достоверность классификации | 0,9375 |
Использование пользовательской модели TensorFlow Lite
Грубый классификатор по умолчанию построен для пяти категорий, предоставляя ограниченную информацию об обнаруженных объектах. Вам может понадобиться более специализированная модель классификатора, которая более подробно охватывает более узкую область понятий; например, модель для различения видов цветов или видов продуктов питания.
Этот API позволяет адаптироваться к конкретному варианту использования, поддерживая пользовательские модели классификации изображений из широкого круга источников. Дополнительные сведения см. в разделе Пользовательские модели с комплектом ML . Пользовательские модели могут быть объединены с вашим приложением или динамически загружены из облака с помощью службы развертывания моделей Firebase Machine Learning.
Предварительная обработка входного изображения
При необходимости обнаружение и отслеживание объектов использует билинейное масштабирование и растяжение изображения, чтобы настроить размер входного изображения и соотношение сторон, чтобы они соответствовали требованиям базовой модели.