MediaPipe ソリューション ガイド

MediaPipe Solutions には、アプリケーションに人工知能(AI)と機械学習(ML)の手法を迅速に適用するためのライブラリとツールのスイートが用意されています。これらのソリューションは、すぐにアプリケーションに接続して、ニーズに合わせてカスタマイズできます。複数の開発プラットフォームで使用できます。MediaPipe Solutions は MediaPipe オープンソース プロジェクトの一部であるため、アプリケーションのニーズに合わせてソリューションのコードをさらにカスタマイズできます。MediaPipe Solutions スイートには以下が含まれています。

MediaPipe ソリューション、スタジオ、モデルメーカーの図

以下のライブラリとリソースは、各 MediaPipe ソリューションのコア機能を提供します。

  • MediaPipe Tasks: ソリューションをデプロイするためのクロス プラットフォームの API とライブラリ。詳細
  • MediaPipe モデル: 各ソリューションで使用できる、事前トレーニング済みですぐに使用できるモデル。

これらのツールを使用すると、ソリューションをカスタマイズして評価できます。

  • MediaPipe Model Maker: 独自のデータを使用して、ソリューションのモデルをカスタマイズします。詳細
  • MediaPipe Studio: ブラウザでソリューションの可視化、評価、ベンチマークを行います。詳細

利用可能なソリューション

MediaPipe ソリューションは複数のプラットフォームで利用できます。各ソリューションには 1 つ以上のモデルが含まれています。一部のソリューションではモデルをカスタマイズすることもできます。次のリストは、サポートされている各プラットフォームで利用可能なソリューションと、Model Maker を使用してモデルをカスタマイズできるかどうかを示します。

解決策 Android Web Python iOS モデルのカスタマイズ
LLM Inference API 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
オブジェクト検出 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
画像分類 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
画像セグメンテーション 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
インタラクティブ セグメンテーション 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
手のランドマーク検出 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
ジェスチャー認識 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
画像の埋め込み 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
顔検出 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
顔ランドマーク検出 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
顔のスタイル設定 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
姿勢ランドマーク検出 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
画像生成 塗りつぶしの円 塗りつぶしの円
テキスト分類 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
テキストの埋め込み 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
言語検出機能 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円
音声分類 塗りつぶしの円 塗りつぶしの円 塗りつぶしの円

始める

MediaPipe Solutions の利用を開始するには、左側のナビゲーション ツリーに表示されているタスク(visionテキストオーディオのタスクなど)から 1 つを選択します。MediaPipe Tasks で使用する開発環境の設定についてサポートが必要な場合は、AndroidウェブアプリPython の設定ガイドをご覧ください。

従来のソリューション

以下の MediaPipe レガシー ソリューションのサポートは、2023 年 3 月 1 日をもって終了しました。他のすべての MediaPipe レガシー ソリューションは、新しい MediaPipe ソリューションにアップグレードされます。詳しくは、以下のリストをご覧ください。すべての MediaPipe Legacy Solutions のコード リポジトリとビルド済みバイナリは、引き続き現状のまま提供されます。

以前のソリューション ステータス 新しい MediaPipe ソリューション
顔検出(情報 アップグレード済み 顔検出
フェイスメッシュ(情報 アップグレード済み 顔ランドマーク検出
Iris(情報 アップグレード済み 顔ランドマーク検出
手(情報 アップグレード済み 手のランドマーク検出
ポーズ(情報 アップグレード済み 姿勢ランドマーク検出
包括的(情報 アップグレード 包括的なランドマーク検出
自撮り写真の分類(情報 アップグレード済み 画像セグメンテーション
ヘア セグメンテーション(情報 アップグレード済み 画像セグメンテーション
オブジェクト検出(情報 アップグレード済み オブジェクト検出
箱の追跡(情報 サポート終了
即時のモーション トラッキング(情報 サポート終了
Objectron(情報 サポート終了
KNIFT(情報 サポート終了
AutoFlip(情報 サポート終了
MediaSequence(情報 サポート終了
YouTube 800 万(情報 サポート終了