การรวบรวมข้อมูล: ทดสอบความเข้าใจ

สําหรับคําถามต่อไปนี้ ให้คลิกลูกศรที่ต้องการเพื่อตรวจคําตอบ

สมมติว่าคุณกําลังสร้างโมเดลแมชชีนเลิร์นนิงที่เกี่ยวกับการโฆษณาและต้องการคาดการณ์การใช้จ่ายของผู้ลงโฆษณาสําหรับเดือนมกราคม คุณมีขีดจํากัดของจํานวนข้อมูลที่สามารถจัดเก็บไว้ในดิสก์ได้ ดังนั้น คุณต้องใช้ข้อมูลเพียงบางส่วนเท่านั้น คุณอาจใช้ข้อมูลล่าสุดล่าสุดทั้งหมดได้ ซึ่งมาจากเดือนก่อนหน้าในเดือนธันวาคม มีคนแนะนําให้คุณสุ่มตัวอย่างข้อมูลตลอดปีที่ผ่านมา สาเหตุใดน่าจะดีกว่าและเพราะเหตุใด
ข้อมูลจากเดือนก่อนหน้า (ธันวาคม)
แม้ว่าข้อมูลนี้จะใหม่กว่า แต่ก็อาจส่งผลให้ได้รับอิทธิพลจากการใช้จ่ายตามฤดูกาลของผู้ลงโฆษณาในช่วงเทศกาลวันหยุดของเดือนธันวาคม
ข้อมูลที่สุ่มตัวอย่างตลอดทั้งปี
ถึงแม้ข้อมูลนี้จะเก่า แต่ก็มีแนวโน้มที่จะได้รับอิทธิพลจากการใช้จ่ายตามฤดูกาลของผู้ลงโฆษณาน้อยลงในช่วงเทศกาลวันหยุดของเดือนธันวาคม
คุณต้องการแสดงวิดีโอที่ผู้ใช้อยากดู โดยใช้วิดีโอที่เคยดูใน YouTube เป็นป้ายกํากับ ป้ายกํากับนี้เป็นแบบโดยตรงหรือได้มาหรือไม่
รับค่ามา
ป้ายกํากับนี้ได้รับมาเนื่องจากไม่ใช่การคาดการณ์ที่คุณต้องการให้สร้าง บางทีผู้ใช้อาจเปิดวิดีโอแต่ปิดไปหลังจากนั้นไม่นาน ระบบจะนับเหตุการณ์นี้เป็นการดูแม้ว่าผู้ใช้จะไม่ดูวิดีโอก็ตาม ในบางกรณี การศึกษาสํานึกดังกล่าวอาจเป็น ตัวเลือกเดียว แต่โปรดระวังเรื่องประเภทป้ายกํากับ (โดยตรงหรือที่ได้รับ) และวิธีที่ขีดจํากัดดังกล่าวคาดการณ์ของคุณ
Direct
แม้ว่าป้ายกํากับดังกล่าวอาจทําให้เกิดการคาดคะเนที่ถูกต้องได้บ่อยครั้ง แต่ป้ายกํากับดังกล่าวไม่ใช่การคาดคะเนที่คุณต้องการดําเนินการ