測驗您的理解程度:實際工作環境中的機器學習

無法在 Colab 中展示管道測試指南。相反地,下列練習可以協助操作指南。下一頁將說明實作指南的資源。

針對以下問題,請按一下您的選項以展開並查看答案。

啟動獨角獸外觀預測器後,您必須重新訓練新資料,讓預測器維持在最新狀態。由於您收集過多新資料以進行訓練,因此您決定在一段時間內取樣新資料,以限制訓練資料。此外,你也需要考量獨角獸外觀的日常與每年圖案。啟動新模型版本的速度最快是每三個月。請問您想選擇多久?
某一天,較大的視窗會產生大量資料,導致模型的訓練時間過長。
不正確。您可以調整資料取樣率,限制資料集的大小。由於您只能每三個月更新一次模型,因此利用一天的資料進行訓練的模型將會逐漸過時。
一週後,資料集才不會太大,但您仍可順利建立模式。
不正確。您可以調整資料取樣率,限制資料集的大小。由於您只能每三個月更新一次模型,因此根據一週資料進行訓練的模型將會逐漸過時。
一年,確保您的模型並未依每日或每年的每年偏誤進行偏誤。
正確!建議您選擇具代表性的資料集,讓模型能在所有情境中學習預測。
你推出了獨角獸外觀預測器。這項功能運作良好!您將進入假期並在三週後回訪,以發現模型品質大幅下降。假設獨角獸行為在三週內不太可能大幅改變。下列何者是造成品質下滑的最可能原因?
訓練/應用偏差。
答對了,雖然獨角獸行為可能並未改變,但收集訓練資料後,放送資料中的基礎資料報告或資料格式可能會有變動。將訓練資料與其他訓練資料進行比較,藉此偵測潛在的訓練/應用偏差。
您忘記以固定門檻測試模型品質。
不正確。測試模型品質有助於發現品質降低,但並不會說明降低的原因。
模型已過時。
答錯了,假設訓練資料涵蓋所有獨角獸行為的週期,如上一題所述。
您需要妥善監控南極洲的預測結果,因為缺少訓練資料不足。您的預測品質各不只會下降幾天,尤其是在冬季時。原因可能為何?
環境因素。
答對了,您發現南極洲的風暴與預測品質的下降息息相關。在這些風暴中,獨角獸的行為會改變。此外,您無法在南極地區的風暴中收集資料,這表示您的模型無法針對這類條件進行訓練。
模型已過時。
不正確。在這種情況下,如果模型過時,就會導致品質降低,不會持續下降幾天。
沒有任何原因。機器學習模型本身即隨機。
不正確。如果您的模型品質波動,您應調查原因。請避免在模型訓練中刪除隨機性,以便增加可重現性。
你的獨角獸外觀預測器已運作一年。您修正了很多問題,現在品質已經很高。但您可能會發現有小問題但持續存在。您的模型品質在都市地區略有下降。請問背後的可能原因為何?
優質的預測內容會讓使用者輕鬆輕鬆找到獨角獸,進而影響獨角獸外觀行為。
答對了,Unicorns 在城市中改變使用者的行為,藉此引起他們的注意。隨著模型的預測結果隨著不斷變化的行為改變,獨角獸仍持續改變其行為。在這種情況下,模型的行為會影響訓練資料本身,因此稱為「意見回饋循環」。 請嘗試修改訓練/應用偏差偵測,以偵測與提供獨角獸行為變化相對應的提供資料變更。
系統會在大量填入大量區域的獨角獸外觀,多次回報你的訓練資料,導致訓練資料偏差。
不正確。這可能的原因並不明顯,因為此偏差應該降低了您啟動產品的品質。
都市區域的模擬工作並不容易。
不正確。如果模型在都市內無法順利進行預測,品質會從一開始就偏低,而非在遊戲推出後逐漸下降。