Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Dans ce cours, nous avons passé en revue de nombreux problèmes courants concernant la qualité des ensembles de données,
à la réflexion à la visualisation
et à l'analyse statistique.
Les professionnels du ML doivent se poser les questions suivantes:
Dans quelle mesure est-ce que je comprends les caractéristiques de mes ensembles de données et les
conditions dans lesquelles ces données
ont été collectées ?
Quels problèmes de qualité ou de biais existent dans mes données ? sont des facteurs de confusion ;
actuellement ?
Quels problèmes potentiels en aval pourraient découler de l'utilisation de ces
des ensembles de données ?
Lors de l'entraînement d'un modèle qui réalise des prédictions ou des classifications :
l'ensemble de données avec lequel le modèle est entraîné contient toutes les variables pertinentes ?
Quelles que soient leurs conclusions, les professionnels du ML doivent toujours examiner
eux-mêmes pour détecter les préjugés de confirmation, puis comparent leurs résultats
l'intuition et le bon sens, et enquêter sur toutes les zones où les données sont en conflit
avec celles-ci.
Autres ressources
Alberto, au Caire. How Charts Lie: Getting Smarter about Visual Information NY:
O.O. Norton, 2019.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/07/26 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Il n'y a pas l'information dont j'ai besoin","missingTheInformationINeed","thumb-down"],["Trop compliqué/Trop d'étapes","tooComplicatedTooManySteps","thumb-down"],["Obsolète","outOfDate","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Mauvais exemple/Erreur de code","samplesCodeIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2024/07/26 (UTC)."],[[["This course explores common data traps encountered in machine learning, encompassing dataset quality, thinking processes, visualization, and statistical analysis."],["Machine learning practitioners must critically assess their datasets, identifying potential biases, confounding factors, and downstream issues arising from data usage."],["Thoroughly understanding data characteristics and collection conditions is crucial for mitigating data pitfalls and ensuring robust machine learning models."],["Confirmation bias should be actively addressed, and data findings should be validated against intuition and common sense, prompting further investigation where discrepancies exist."],["Further insights into data analysis and interpretation can be gained from the listed additional reading materials covering topics like chart interpretation, statistical manipulation, and map-based data representation."]]],[]]