Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Pengantar
Modul ini dimulai dengan pertanyaan utama.
Pilih salah satu jawaban berikut:
Jika Anda harus memprioritaskan untuk memperbaiki salah satu area berikut
dalam project machine learning Anda, yang akan memberikan
dampak?
Meningkatkan kualitas set data Anda
Data mengalahkan segalanya.
Kualitas dan ukuran {i>dataset<i} menjadi jauh lebih penting
canggih yang Anda gunakan untuk membangun model.
Menerapkan fungsi kerugian yang lebih cerdas untuk melatih model Anda
Benar, fungsi kerugian yang lebih baik dapat membantu model berlatih lebih cepat, tetapi
jaraknya masih terlalu jauh dari
item lain dalam daftar ini.
Dan inilah pertanyaan yang jauh lebih penting:
Coba tebak: Dalam project machine learning Anda, berapa lama waktu
yang biasanya Anda habiskan untuk persiapan dan transformasi data?
Lebih dari setengah waktu proyek
Ya, praktisi ML menghabiskan sebagian besar waktu mereka
membangun set data dan
melakukan rekayasa fitur.
Kurang dari setengah waktu proyek
Rencanakan untuk yang lain! Biasanya, 80% waktu penggunaan machine learning
proyek dihabiskan untuk membangun {i>dataset<i} dan mengubah data.
Dalam modul ini, Anda akan mempelajari
lebih lanjut karakteristik machine learning
{i>dataset<i}, dan cara mempersiapkan data Anda untuk memastikan hasil yang berkualitas tinggi.
melatih dan mengevaluasi model Anda.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Informasi yang saya butuhkan tidak ada","missingTheInformationINeed","thumb-down"],["Terlalu rumit/langkahnya terlalu banyak","tooComplicatedTooManySteps","thumb-down"],["Sudah usang","outOfDate","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Masalah kode / contoh","samplesCodeIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2024-08-13 UTC."],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]