Сканер документов

Оцифровка физических документов, позволяющая пользователям преобразовывать их в цифровые форматы, стала очень распространённой задачей для пользователей мобильных приложений. API сканера документов ML Kit предоставляет комплексное решение с высококачественным и единообразным пользовательским интерфейсом для всех приложений и устройств Android. После запуска процесса сканирования документов из вашего приложения пользователи сохраняют полный контроль над процессом сканирования. При желании они могут обрезать отсканированные документы, применять фильтры, удалять тени и пятна, а также легко отправлять оцифрованные файлы обратно в ваше приложение.

Поток пользовательского интерфейса, модели машинного обучения и другие крупные ресурсы предоставляются с использованием сервисов Google Play, что означает:

  • Низкое влияние на размер двоичного кода (все модели машинного обучения и большие ресурсы загружаются централизованно в сервисы Google Play).
  • Разрешение на использование камеры не требуется — сканер документов использует разрешение на использование камеры сервисов Google Play, и пользователи сами решают, какие файлы отправлять в ваше приложение.

Весь процесс сканирования документов происходит на устройстве.

Андроид

Ключевые возможности

  • Высококачественный и последовательный пользовательский интерфейс для оцифровки физических документов.
  • Автоматический захват с обнаружением документов.
  • Точное определение кромок для оптимальных результатов обрезки.
  • Автоматическое определение поворота для отображения документов в вертикальном положении.
  • Функции редактирования позволяют обрезать изображения, применять фильтры, удалять тени, очищать пятна и легко отправлять оцифрованные файлы обратно в приложение.
  • Обработка на устройстве с сохранением конфиденциальности пользователя.
  • Вашему приложению не требуется разрешение на использование камеры.
  • Низкое влияние на размер двоичного файла APK.

Настройка

API сканера документов обеспечивает полноценный высококачественный пользовательский интерфейс, единый для всех приложений Android. Однако есть возможность настраивать некоторые аспекты пользовательского опыта:

  • Максимальное количество страниц:
    Установите ограничение на количество сканируемых страниц.

  • Импорт галереи:
    Включить или отключить возможность импорта из фотогалереи.

  • Функции редактирования:
    Настройте доступные пользователю функции редактирования, выбрав один из 3 режимов:

    • SCANNER_MODE_BASE : базовые возможности редактирования (обрезка, поворот, изменение порядка страниц и т. д.).
    • SCANNER_MODE_BASE_WITH_FILTER : добавляет фильтры изображений (оттенки серого, автоматическое улучшение изображения и т. д.) в режим SCANNER_MODE_BASE .
    • SCANNER_MODE_FULL (по умолчанию): добавляет возможности очистки изображений с помощью машинного обучения (удаление пятен, отпечатков пальцев и т. д.) в режим SCANNER_MODE_BASE_WITH_FILTER . Этот режим также позволит автоматически добавлять будущие важные функции вместе с обновлениями сервисов Google Play, в то время как два других режима сохранят текущий набор функций и получат лишь незначительные улучшения.
Базовый режим Базовый режим с фильтром Полный режим

Примеры результатов

Оригинальное изображение Отсканированный документ с исправленной перспективой, удаленными морщинами и примененным фильтром оттенков серого
Оригинальное изображение Отсканированный документ автоматически повернут, пятна удалены, и применен цветовой фильтр
Оригинальное изображение Отсканированный документ с удаленными пятнами и примененным автоматическим фильтром
Оригинальное изображение Отсканированный документ автоматически повернут, тень удалена, применен автоматический фильтр
Оригинальное изображение Отсканированный документ автоматически повернут, палец убран, применен автоматический фильтр