Processus de préparation des données et d'extraction de caractéristiques

Quel est le processus ?

Comme indiqué précédemment, ce cours porte sur la construction et la transformation de votre ensemble de données.

La construction de votre ensemble de données implique les tâches suivantes: 1. Collectez des données brutes.  2. Identifiez les sources de caractéristiques et de libellés. 3. Sélectionnez une stratégie d'échantillonnage.
4. Diviser les données La transformation des données implique les tâches suivantes :
1. Explorez et nettoyez vos données. 2. Effectuer une extraction de caractéristiques

À noter :

  • La figure montre un processus typique, qui peut ne pas être idéal pour chaque projet. Ce cours s'applique principalement aux régressions linéaires et aux réseaux de neurones.
  • Le processus affiché n'est pas toujours séquentiel. Vous pouvez, par exemple, diviser vos données après leur transformation. Vous devrez peut-être collecter plus de données. Vous aurez peut-être besoin de modifier l'ensemble de caractéristiques, même après le début de l'entraînement, car vous apprenez empiriquement ce qui fonctionne et ce qui ne fonctionne pas.

Combien de temps cela prend-il ?

Pour la question suivante, cliquez sur la flèche de votre choix pour vérifier votre réponse:

Imaginons que dans votre projet de machine learning, combien de temps vous passerez-vous généralement à la préparation et à la transformation des données ?
Plus de la moitié du temps de projet
Bonne réponse: vous passerez la majorité de votre temps sur un projet de machine learning à créer des ensembles de données et à transformer des données.
Moins de la moitié du temps du projet
Préparez-vous ! En règle générale, un projet à 80% de son temps est consacré à la construction d'ensembles de données et à la transformation de données.