ML Kit は、Google の機械学習の専門知識を、パワフルで使いやすいパッケージでモバイル デベロッパーに提供します。デバイス上での実行に最適化されたソリューションにより、iOS アプリや Android アプリの魅力、パーソナライズ、利便性を向上させることができます。
ML Kit の処理はデバイス上で行われます。これにより、処理が高速になり、カメラ入力の処理などのリアルタイムのユースケースが可能になります。オフラインでも動作し、デバイスに残す必要がある画像やテキストの処理に使用できます。
Google 独自のモバイル エクスペリエンスを支える機械学習テクノロジーを活用できます。
Google は、最高水準の機械学習モデルと高度な処理パイプラインを組み合わせて、使いやすい API を通じて提供し、アプリで強力なユースケースを実現します。

Vision API

画像にラベルを付け、バーコード、テキスト、顔、オブジェクトを検出する動画および画像の分析 API。
バーコードをスキャンして処理します。ほとんどの標準的な 1D および 2D 形式をサポートします。
顔と顔のランドマークを検出します。
近距離の画像で顔のメッシュ情報を検出します。
画像からテキストを認識して抽出します。
物体、場所、活動、動物の種類、商品などを識別します。汎用のベースモデルを使用するか、カスタム TensorFlow Lite モデルでユースケースに合わせて調整します。
ライブカメラフィード内の 1 つ以上のオブジェクトをローカライズし、リアルタイムで追跡します。
タッチ スクリーンなどのデジタル サーフェス上で、手書きのテキストと手書きの図形を認識します。300 以上の言語、絵文字、基本的な図形を認識します。
人体の位置をリアルタイムで検出します。
シーン内でユーザーの背景を分離し、重要なことに集中します。
写真の背景と被写体(人、ペット、物など)を分離する。
画像から物理的なドキュメントをデジタル化します。

Natural Language API

58 の言語を識別して翻訳し、返信の候補を表示する自然言語処理 API。
数語のテキストの文字列の言語を判別する。
デバイス上ですべてを 58 の言語間で翻訳。
テキスト メッセージでの会話に返信候補を生成します。
エンティティ(住所、日時、電話番号など)を検出して特定し、そのエンティティに基づいてアクションを実行します。15 の言語に対応しています。