Koleksiyonlar ile düzeninizi koruyun
İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.
Kullanıcılara yiyecek öneren bir uygulama geliştirdiğinizi hayal edin. Uygulama, en sevdikleri yiyecekleri giren kullanıcılara beğenebilecekleri benzer yiyecekler öneriyor. Yiyeceklerin benzer olup olmadığını tahmin edebilen bir makine öğrenimi (ML) modeli geliştirerek uygulamanızın isabetli önerilerde (ör. "Pankek seviyorsanız size krep öneriyoruz.") bulunmasını istiyorsunuz.
Modelinizi eğitmek için 5.000 popüler yiyecekten oluşan bir veri kümesi oluşturuyorsunuz. Bu yiyecekler arasında borş çorbası, sosisli, salata, pizza ve döner yer alıyor.
1. şekil Yiyecek veri kümesindeki yiyecek örnekleri
Veri kümesinde yiyeceklerden her birinin one-hot kodlama temsilini içeren meal özelliği oluşturuyorsunuz.
Kodlama, modelin eğitileceği veriler için ilk sayısal temsili belirleme sürecini ifade eder.
2. şekil. Borş çorbası, sosisli ve dönerin one-hot kodlamaları.
Her bir one-hot kodlama vektörünün uzunluğu 5.000'dir (veri kümesindeki her bir menü öğesi için bir giriş). Diyagramdaki üç nokta işareti, gösterilmeyen 4.995 girişi temsil eder.
Seyrek veri temsillerinde sık karşılaşılan sorunlar
One-hot kodlamaları incelerken bu veri temsiliyle ilgili çeşitli sorunları fark etmiş olabilirsiniz.
Ağırlık sayısı: Büyük giriş vektörleri, nöral ağ için çok sayıda ağırlık anlamına gelir.
One-hot kodlamanızda M giriş ve girişten sonra ağın ilk katmanında N düğüm varsa modelin ilgili katman için MxN ağırlığı eğitmesi gerekir.
Veri noktası sayısı: Modelinizde ağırlık arttıkça düzgün şekilde eğitmeniz gereken veri miktarı da artar.
İşlem miktarı: Ağırlık arttıkça modeli eğitmek ve kullanmak için gereken işlem yükü de artar. Donanımınızın kapasitesi hızlıca aşılabilir.
Bellek miktarı: Modelinizde ağırlık arttıkça modeli eğiten ya da çalıştıran hızlandırıcı donanımlarda daha fazla belleğe ihtiyaç olur. Büyüyen bir sistemi etkili şekilde yönetmek oldukça zordur.
Cihaz üzerinde makine öğrenimini (ODML) desteklemeyle ilgili zorluklar:
Makine öğrenimi modelinizi sunucular yerine yerel cihazlarda çalıştırmayı hedefliyorsanız modelinizi küçültmeye odaklanmalı ve ağırlık sayısını azaltmaya çalışmalısınız.
Bu modülde, bu sorunları gideren düşük boyutlu seyrek veri temsilleri olan yerleştirmeleri oluşturmayı öğreneceksiniz.
[[["Anlaması kolay","easyToUnderstand","thumb-up"],["Sorunumu çözdü","solvedMyProblem","thumb-up"],["Diğer","otherUp","thumb-up"]],[["İhtiyacım olan bilgiler yok","missingTheInformationINeed","thumb-down"],["Çok karmaşık / çok fazla adım var","tooComplicatedTooManySteps","thumb-down"],["Güncel değil","outOfDate","thumb-down"],["Çeviri sorunu","translationIssue","thumb-down"],["Örnek veya kod sorunu","samplesCodeIssue","thumb-down"],["Diğer","otherDown","thumb-down"]],["Son güncelleme tarihi: 2025-05-20 UTC."],[[["This module explains how to create embeddings, which are lower-dimensional representations of sparse data that address the problems of large input vectors and lack of meaningful relations between vectors in one-hot encoding."],["One-hot encoding creates large input vectors, leading to a huge number of weights in a neural network, requiring more data, computation, and memory."],["One-hot encoding vectors lack meaningful relationships, failing to capture semantic similarities between items, like the example of hot dogs and shawarmas being more similar than hot dogs and salads."],["Embeddings offer a solution by providing dense vector representations that capture semantic relationships and reduce the dimensionality of data, improving efficiency and performance in machine learning models."],["This module assumes familiarity with introductory machine learning concepts like linear regression, categorical data, and neural networks."]]],[]]