Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Les professionnels du ML passent beaucoup plus de temps à évaluer, nettoyer et transformer les données qu'à créer des modèles.
Les données sont si importantes que ce cours leur consacre trois unités complètes :
Travailler avec des données numériques (cette unité)
Ce module est consacré aux
données numériques
c'est-à-dire des entiers
ou des valeurs à virgule flottante
qui se comportent comme des chiffres. C'est-à-dire qu'ils sont additifs,
dénombrables, ordonnés,
et ainsi de suite. Le module suivant porte sur
données catégorielles, qui peuvent
incluent des nombres qui se comportent
comme des catégories. Le troisième module explique comment
Préparer les données pour garantir des résultats de haute qualité lors de l'entraînement et de l'évaluation
votre modèle.
Voici quelques exemples de données numériques :
Température
Poids
Nombre de cerfs hivernant dans une réserve naturelle
En revanche, les codes postaux américains,
étant des nombres à cinq ou neuf chiffres, ne se comportent pas comme des nombres ou représentent
des relations mathématiques. Le code postal 40004 (dans le comté de Nelson, Kentucky) est
et non le double du code postal 20002 (à Washington, D.C.). Ces chiffres représentent des catégories, en particulier des zones géographiques, et sont considérés comme des données catégorielles.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/27 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/07/27 (UTC)."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]