Fazit

Die Textklassifizierung ist ein grundlegendes Problem des maschinellen Lernens, das in verschiedenen Produkten Anwendung findet. In diesem Leitfaden haben wir den Workflow für die Textklassifizierung in mehrere Schritte unterteilt. Für jeden Schritt haben wir einen individuellen Ansatz vorgeschlagen, der auf den Merkmalen Ihres spezifischen Datasets basiert. Insbesondere anhand des Verhältnisses der Anzahl der Stichproben zur Anzahl der Wörter pro Stichprobe schlagen wir einen Modelltyp vor, mit dem Sie schnell die beste Leistung erzielen. Die anderen Schritte sind auf diese Auswahl abgestimmt. Wir hoffen, dass Sie mit dieser Anleitung, dem Begleitcode und dem Flussdiagramm schnell eine erste Lösung für Ihr Problem bei der Textklassifizierung finden.