Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Introduzione
Questo modulo inizia con una domanda guida.
Scegli una delle seguenti risposte:
Se dovessi dare la priorità al miglioramento di una delle seguenti aree
nel tuo progetto di machine learning, quale avrebbe un impatto maggiore?
Migliorare la qualità del set di dati
I dati sono più importanti di tutto.
La qualità e le dimensioni del set di dati sono molto più importanti dell'algoritmo di Shiny che utilizzi per creare il modello.
Applicazione di una funzione di perdita più intelligente all'addestramento del modello
È vero, una funzione di perdita migliore può aiutare un modello ad addestrarsi più velocemente, ma rimane comunque molto indietro rispetto a un altro elemento di questo elenco.
Una domanda ancora più insolita:
Indovina: nel tuo progetto di machine learning, quanto tempo
in genere investi in preparazione e trasformazione dei dati?
Più della metà del tempo del progetto
Sì, gli esperti di ML dedicano la maggior parte del loro tempo alla creazione di set di dati e al feature engineering.
Meno della metà del tempo del progetto
Pianifica di più. Di solito, l'80% delle volte utilizza il machine learning
alla creazione di set di dati e alla trasformazione dei dati.
In questo modulo scoprirai di più sulle caratteristiche del machine learning
set di dati e come prepararli per garantire risultati di alta qualità
per l'addestramento e la valutazione
del modello.
[[["Facile da capire","easyToUnderstand","thumb-up"],["Il problema è stato risolto","solvedMyProblem","thumb-up"],["Altra","otherUp","thumb-up"]],[["Mancano le informazioni di cui ho bisogno","missingTheInformationINeed","thumb-down"],["Troppo complicato/troppi passaggi","tooComplicatedTooManySteps","thumb-down"],["Obsoleti","outOfDate","thumb-down"],["Problema di traduzione","translationIssue","thumb-down"],["Problema relativo a esempi/codice","samplesCodeIssue","thumb-down"],["Altra","otherDown","thumb-down"]],["Ultimo aggiornamento 2025-07-27 UTC."],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]