Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Questo corso ha esaminato molte trappole di dati comuni, dalla qualità dei set di dati
alla visualizzazione e all'analisi statistica.
I professionisti di ML dovrebbero chiedersi:
Qual è il grado di comprensione delle caratteristiche dei miei set di dati e
le condizioni in cui sono stati raccolti i dati?
Quali problemi di qualità o bias sono presenti nei miei dati? I fattori di confusione sono
presenti?
Quali potenziali problemi downstream potrebbero derivare dall'uso di questi
di set di dati?
Durante l'addestramento di un modello che esegue previsioni o classificazioni:
il set di dati su cui viene addestrato il modello contiene tutte le variabili pertinenti?
Qualunque siano i risultati, i professionisti di ML dovrebbero sempre esaminare
eventuali bias di conferma, quindi confrontate i risultati
l'intuizione e il buon senso e analizza i punti in cui i dati sono in conflitto
con questi elementi.
Letture aggiuntive
Il Cairo, Alberto. In che modo i grafici mento: informazioni visive in modo più intelligente. Roma:
O Norton, 2019.
Uff, Darrell. Come mentire sulle statistiche. NY: W.W. Norton, 1954.
Monmonier, Mark. How to Lie with Maps,3a edizione Chicago: U of Chicago P, 2018.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2024-07-26 UTC."],[[["This course explores common data traps encountered in machine learning, encompassing dataset quality, thinking processes, visualization, and statistical analysis."],["Machine learning practitioners must critically assess their datasets, identifying potential biases, confounding factors, and downstream issues arising from data usage."],["Thoroughly understanding data characteristics and collection conditions is crucial for mitigating data pitfalls and ensuring robust machine learning models."],["Confirmation bias should be actively addressed, and data findings should be validated against intuition and common sense, prompting further investigation where discrepancies exist."],["Further insights into data analysis and interpretation can be gained from the listed additional reading materials covering topics like chart interpretation, statistical manipulation, and map-based data representation."]]],[]]