מסקנות סטטיות לעומת מסקנות דינמיות

תוכלו לבחור באחת מאסטרטגיות ההסקת הבאות:

  • הסקת מסקנות אופליין, כלומר יוצרים את כל החיזויים האפשריים בבת אחת, באמצעות מיפוי ב-MapDownload או משהו דומה. לאחר מכן כותבים את החיזויים ל-SSTable או ב-Bigtable, ואז מזינים אותם בטבלת מטמון/חיפוש.
  • הֶקֵּשׁ אונליין, כלומר חיזוי לפי דרישה באמצעות שרת.

בסרטון הבא (2 דקות) מפורט מידע נוסף על מסקנות סטטיות לעומת מסקנות דינמיות.

מסקנות סטטיות לעומת דינמיות

מסקנות אופליין

  • בצעו את כל החיזויים האפשריים בבת אחת, באמצעות Mapreduce או דוח דומה.
  • כותבים לטבלה ואז מזינים אותם בטבלת מטמון/חיפוש.

מסקנות מקוונות

  • חיזוי לפי דרישה באמצעות שרת.

מסקנות אופליין

  • בצעו את כל החיזויים האפשריים בבת אחת, באמצעות Mapreduce או דוח דומה.
  • כותבים לטבלה ואז מזינים אותם בטבלת מטמון/חיפוש.
  • הצד השני: אין צורך לדאוג הרבה לגבי עלות ההסקה.
  • בהפוך: סביר להניח שישתמשו במכסת פריטים מרובים.
  • בצד שמאל: ניתן לבצע לאחר אימות של חיזויים על נתונים לפני שליחתם.

מסקנות אופליין

  • בצעו את כל החיזויים האפשריים בבת אחת, באמצעות Mapreduce או דוח דומה.
  • כותבים לטבלה ואז מזינים אותם בטבלת מטמון/חיפוש.
  • הצד השני: אין צורך לדאוג הרבה לגבי עלות ההסקה.
  • בהפוך: סביר להניח שישתמשו במכסת פריטים מרובים.
  • בצד שמאל: ניתן לבצע אימות לאחר אימות על חיזויים של נתונים לפני שליחתם.
  • חסרונות: יכולים לחזות רק דברים שאנחנו יודעים עליהם – גרוע ל"זנב ארוך".
  • חסרונות: זמן האחזור של העדכון נמדד ככל הנראה בשעות או בימים.

מסקנות מקוונות

  • חיזוי לפי דרישה באמצעות שרת.
  • בצד שמאל: ניתן לחזות כל פריט חדש כשהוא יגיע – מעולה ל"זנב ארוך".

מסקנות מקוונות

  • חיזוי לפי דרישה באמצעות שרת.
  • בצד שמאל: ניתן לחזות כל פריט חדש כשהוא יגיע – מעולה ל"זנב ארוך".
  • חסרונות: מחשוב אינטנסיבי ותלוי זמן אחזור - עשוי להגביל את מורכבות המודל.
  • החסרון: המעקב אינטנסיבי יותר.

סיכום של הרצאה בווידאו

לפניכם היתרונות והחסרונות של מסקנות אופליין:

  • יתרונות: אין צורך לדאוג יותר מדי לגבי עלות ההסקה.
  • יתרון: סביר להניח שישתמשו במכסת אצווה או להשתמש ב-Map האדמין Google ענק.
  • יתרון: ניתן לבצע אימות לאחר אימות של חיזויים לפני הדחיפה.
  • חסרון: ניתן לחזות רק דברים שידועים לנו — רע ל"זנב ארוך".
  • חסרון: זמן האחזור של העדכון נמדד ככל הנראה בשעות או בימים.

לפניכם היתרונות והחסרונות של מסקנות אונליין:

  • יתרונות: אפשר לבצע חיזוי לגבי כל פריט חדש שמגיע – מעולה בשביל "זנב ארוך".
  • חסרונות: מחשוב אינטנסיבי ותלוי זמן אחזור, עלול להגביל את מורכבות המודל.
  • חסרון: המעקב אינטנסיבי יותר.