Veri Toplama: Bilgilerinizi Anlama

Aşağıdaki sorular için yanıtınızı kontrol etmek üzere istediğiniz oku tıklayın:

Reklamcılıkla ilgili bir makine öğrenimi modeli üzerinde çalıştığınızı ve Ocak ayındaki reklamveren harcamalarını tahmin etmek istediğinizi varsayalım. Diskte depolayabileceğiniz veri miktarıyla ilgili sınırlarınız vardır. Bu nedenle, kullanılabilir verilerin yalnızca bir alt kümesini kullanmanız gerekir. Aralık ayının önceki ayına ait en güncel verilerin tümünü kullanabilirsiniz. Bir başkası, geçen yılki verileri kullanmanızı öneriyor. Aşağıdakilerden hangisi neden daha iyi olabilir?
Önceki aya ait veriler (Aralık)
Bu veriler daha yeni olsa da Aralık ayı tatillerinden önce yapılan harcamaların sezonluk etkisinden etkilenebilir.
Yıl boyunca toplanan veriler
Bu veriler eski olsa da Aralık ayı tatillerinden önce reklamveren harcamalarının sezon etkisinden etkilenme olasılığı daha düşüktür.
Kullanıcıların izlemek istediği videoları göstermek istiyorsanız. YouTube'da izledikleri videoları etiket olarak kullanırsınız. Bu etiket doğrudan mı yoksa türetilmiş mi?
Türetilmiş
Bu etiket, yapmak istediğiniz tahminin aynı olmaması nedeniyle türetilmiştir. Kullanıcı videoyu açmış ancak kısa bir süre sonra kapatmış olabilir. Bu etkinlik, kullanıcı videoyu izlememiş olsa bile bir görüntüleme olarak sayılır. Bazı durumlarda bunun gibi bir buluşsal yöntem seçeneğiniz olabilir ancak etiket türünüzü (doğrudan veya türetilmiş) ve tahminlerinizi nasıl sınırladığını unutmayın.
Aktarmasız
Bu etiket çoğu zaman doğru bir tahminle sonuçlanabilse de, yapmak istediğiniz tahminin aynısı değildir.