MediaPipe-Lösungsleitfaden

MediaPipe Solutions bietet eine Reihe von Bibliotheken und Tools, mit denen Sie Techniken für künstliche Intelligenz (KI) und maschinelles Lernen (ML) schnell in Ihren Anwendungen anwenden können. Sie können diese Lösungen sofort in Ihre Anwendungen einbinden, an Ihre Anforderungen anpassen und auf mehreren Entwicklungsplattformen verwenden. MediaPipe Solutions ist Teil des Open-Source-Projekts von MediaPipe. Sie können den Lösungscode also weiter an Ihre Anwendungsanforderungen anpassen. Die MediaPipe-Lösungssuite umfasst Folgendes:

Diagramm der MediaPipe-Lösungen, Studio und Model Maker

Diese Bibliotheken und Ressourcen stellen die Hauptfunktionen der einzelnen MediaPipe-Lösungen bereit:

  • MediaPipe-Aufgaben: Plattformübergreifende APIs und Bibliotheken für die Bereitstellung von Lösungen Weitere Informationen
  • MediaPipe-Modelle: Vortrainierte, einsatzbereite Modelle zur Verwendung mit jeder Lösung.

Mit diesen Tools können Sie Lösungen anpassen und bewerten:

  • MediaPipe Model Maker: Passen Sie Modelle für Lösungen mit Ihren Daten an. Weitere Informationen
  • MediaPipe Studio: Damit lassen sich Lösungen in Ihrem Browser visualisieren, bewerten und Benchmarks erstellen. Weitere Informationen

Verfügbare Lösungen

MediaPipe-Lösungen sind auf mehreren Plattformen verfügbar. Jede Lösung enthält ein oder mehrere Modelle. Außerdem können Sie Modelle für einige Lösungen anpassen. In der folgenden Liste sehen Sie, welche Lösungen für jede unterstützte Plattform verfügbar sind und ob Sie das Modell mit Model Maker anpassen können:

Lösung Android Web Python iOS Modell anpassen
LLM Inference API ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Objekterkennung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Bildklassifizierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Bildsegmentierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Interaktive Segmentierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Erkennung von Hand-Markierungen ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Bewegungserkennung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Bilder einbetten ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Gesichtserkennung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Erkennung von Sehenswürdigkeiten ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Gesichtsstilisierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Erkennung von Positionsmarkierungen ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Bildgenerierung ausgefüllter Kreis ausgefüllter Kreis
Textklassifizierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Texteinbettung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Spracherkennung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis
Audioklassifizierung ausgefüllter Kreis ausgefüllter Kreis ausgefüllter Kreis

Erste Schritte

Wählen Sie zum Einstieg in MediaPipe Solutions eine der Aufgaben aus, die im linken Navigationsbaum aufgeführt sind, einschließlich vision-, Text- und Audio-Aufgaben. Wenn Sie Hilfe beim Einrichten einer Entwicklungsumgebung für die Verwendung mit MediaPipe Tasks benötigen, lesen Sie die Einrichtungsleitfäden für Android, Webanwendungen und Python.

Legacy-Lösungen

Wir haben den Support für die unten aufgeführten MediaPipe-Legacy-Lösungen zum 1. März 2023 eingestellt. Für alle anderen MediaPipe-Legacy-Lösungen wird ein Upgrade auf eine neue MediaPipe-Lösung durchgeführt. Weitere Informationen finden Sie in der Liste unten. Das Code-Repository und die vordefinierten Binärdateien für alle Legacy-Lösungen von MediaPipe werden weiterhin wie vorhanden zur Verfügung gestellt.

Legacy-Lösung Status Neue MediaPipe-Lösung
Gesichtserkennung (weitere Informationen) Aktualisiert Gesichtserkennung
Face Mesh (Informationen) Aktualisiert Erkennung von Gesichtspunkten
Iris (Informationen) Aktualisiert Erkennung von Gesichtspunkten
Hände (Info) Aktualisiert Erkennung von Hand-Orientierungspunkten
Position (Info) Aktualisiert Erkennung von Sehenswürdigkeiten
Ganzheitlich (weitere Informationen) Upgrade Ganzheitliche Erkennung von Sehenswürdigkeiten
Selfie-Segmentierung (weitere Informationen) Aktualisiert Bildsegmentierung
Haarsegmentierung (weitere Informationen) Aktualisiert Bildsegmentierung
Objekterkennung (weitere Informationen) Aktualisiert Objekterkennung
Tracking von Paketen (weitere Informationen) Support nicht mehr verfügbar
Bewegungserkennung (weitere Informationen) Support nicht mehr verfügbar
Objectron (Informationen) Support nicht mehr verfügbar
KNIFT (Informationen) Support nicht mehr verfügbar
AutoFlip (Informationen) Support nicht mehr verfügbar
MediaSequence (Informationen) Support nicht mehr verfügbar
YouTube 8M (weitere Informationen) Support nicht mehr verfügbar