Introduction

Les forêts de décision offrent les avantages suivants:

  • Ils sont plus faciles à configurer que les réseaux de neurones. Les forêts de décision ont moins d'hyperparamètres. De plus, les hyperparamètres des forêts de décision fournissent de bonnes valeurs par défaut.
  • Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Cela signifie que vous pouvez écrire beaucoup moins de code de prétraitement qu'en utilisant un réseau de neurones, ce qui vous fait gagner du temps et réduit les sources d'erreur.
  • Ils donnent souvent de bons résultats prêts à l'emploi, résistent aux données contenant du bruit et présentent des propriétés interprétables.
  • Ils infèrent et s'entraînent sur de petits ensembles de données (moins d'un million d'exemples) beaucoup plus rapidement que les réseaux de neurones.

Les forêts de décision génèrent d'excellents résultats dans les compétitions de machine learning et sont très utilisées dans de nombreuses tâches industrielles.

Ce cours présente les arbres de décision et les forêts de décision. Les forêts de décision sont une famille d'algorithmes de machine learning interprétables qui excellent avec les données tabulaires. Les forêts de décision peuvent effectuer les opérations suivantes:

Code YDF
Ce cours explique comment fonctionnent les forêts de décision sans vous concentrer sur des bibliothèques spécifiques. Cependant, tout au long du cours, les zones de texte présentent des exemples de code qui s'appuient sur la bibliothèque de forêt de décision YDF, mais qui peuvent être converties en autres bibliothèques de forêt de décision.

Prérequis

Pour ce cours, nous partons du principe que vous avez suivi les cours suivants ou que vous disposez de connaissances équivalentes:

Bonne formation !