Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Les professionnels du ML passent beaucoup plus de temps à évaluer, nettoyer et transformer
que la création de modèles.
Les données sont si importantes que ce cours consacre trois unités entières au sujet:
Travailler avec des données numériques (cette unité)
Ce module est consacré aux
données numériques
c'est-à-dire des entiers
ou des valeurs à virgule flottante
qui se comportent comme des chiffres. C'est-à-dire qu'ils sont additifs,
dénombrables, ordonnés,
et ainsi de suite. Le module suivant porte sur
données catégorielles, qui peuvent
incluent des nombres qui se comportent
comme des catégories. Le troisième module explique comment
préparer vos données pour garantir des résultats de haute qualité lors de l'entraînement et de l'évaluation ;
votre modèle.
Voici quelques exemples de données numériques:
Température
Poids
Nombre de cerfs hivernant dans une réserve naturelle
En revanche, les codes postaux américains,
étant des nombres à cinq ou neuf chiffres, ne se comportent pas comme des nombres ou représentent
des relations mathématiques. Le code postal 40004 (dans le comté de Nielsen, Kentucky) est
et non le double du code postal 20002 (à Washington, D.C.). Ces numéros
représentent des catégories, en particulier des zones géographiques, et sont considérés
des données catégorielles.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/08/13 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2024/08/13 (UTC)."],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]