ドキュメント スキャナ

物理ドキュメントをデジタル化して、ユーザーが物理ドキュメントをデジタル形式に変換できるようにすることは、モバイルアプリで非常に一般的なユーザー ジャーニーになっています。ML Kit のドキュメント スキャナ API は、Android アプリとデバイス全体で高品質で一貫性のある UI フローを実現する包括的なソリューションを提供します。アプリからドキュメント スキャナ フローがトリガーされると、ユーザーはスキャン プロセスを完全に制御できます。スキャンしたドキュメントをトリミングしたり、フィルタを適用したり、影や汚れを取り除いたりして、デジタル化したファイルをアプリに簡単に送り返すこともできます。

UI フロー、ML モデル、その他の大規模なリソースは Google Play 開発者サービスを使用して配信されます。つまり、

  • バイナリ サイズへの影響が少ない(すべての ML モデルと大きなリソースは Google Play 開発者サービスで一元的にダウンロードされます)。
  • カメラの権限は必要ありません。ドキュメント スキャナは Google Play 開発者サービスのカメラの権限を利用します。ユーザーは、アプリと共有するファイルを自分で選択できます。

ドキュメント スキャナのフロー全体がデバイス上で動作します。

Android

主な機能

  • 物理的なドキュメントをデジタル化するための高品質で一貫性のあるユーザー インターフェース。
  • ドキュメント検出による自動キャプチャ。
  • 作物の最適な結果を得るための正確なエッジ検出。
  • ドキュメントを垂直に表示するための自動回転検出。
  • 編集機能を使用して、トリミング、フィルタの適用、影の除去、汚れの除去を行い、スキャンしたファイルをアプリにシームレスに送り返すことができます。
  • デバイス上で処理されるため、ユーザーのプライバシーが保護されます。
  • アプリからカメラの権限を要求する必要はありません。
  • APK バイナリサイズへの影響は小さい。

カスタマイズ

ドキュメント スキャナ API は、Android アプリ全体で一貫性のある高品質の完全な UI フローを提供します。ただし、ユーザー エクスペリエンスの一部をカスタマイズすることもできます。

  • 最大ページ数:
    スキャンするページ数の上限を設定します。

  • ギャラリーのインポート:
    フォト ギャラリーからのインポート機能を有効または無効にします。

  • 編集機能:
    3 つのモードから選択して、ユーザーが利用できる編集機能をカスタマイズします。

    • SCANNER_MODE_BASE: 基本的な編集機能(切り抜き、回転、ページの並べ替えなど)。
    • SCANNER_MODE_BASE_WITH_FILTER: SCANNER_MODE_BASE モードに画像フィルタ(グレースケール、自動画像補正など)を追加します。
    • SCANNER_MODE_FULL(デフォルト): SCANNER_MODE_BASE_WITH_FILTER モードに ML 対応の画像クリーニング機能(シミや指などを消去)を追加します。このモードでは、Google Play 開発者サービスのアップデートとともに、将来の主要な機能も自動的に追加されます。他の 2 つのモードでは、現在の機能セットが維持され、軽微な改善のみが適用されます。
基本モード フィルタを使用したベースモード フルモード

検索結果の例

元の写真 遠近法が修正され、しわが除去され、グレースケール フィルタが適用されたスキャンした書類
元の写真 スキャンしたドキュメントが自動回転し、汚れが除去され、カラーフィルタが適用されている
元の写真 汚れが除去され、自動フィルタが適用されたスキャンしたドキュメント
元の写真 スキャンしたドキュメントが自動回転し、影が除去され、自動フィルタが適用された状態
元の写真 スキャンしたドキュメントが自動回転し、指が離れて自動フィルタが適用された状態