本頁面由 Cloud Translation API 翻譯而成。

瞭解您的理解：模型偵錯

針對以下問題，請按一下您的選項以展開並查看答案。

模擬方法

您和好友 Mel 就像獨角獸一樣。事實上，您非常喜歡獨角獸，因此決定使用機器學習來預測獨角獸的外貌。您有一個包含 10,000 個獨角獸外觀的資料集。每次外觀時，資料集都會包含位置、時段、高度、溫度、濕度、人口密度、樹木遮蔽、彩虹和許多其他功能。

想要開始開發機器學習模型。下列何者是開始開發的好方法？

獨角獸常常在黎明與黃昏時出現。因此，請使用「時段」功能來建立線性模型。

答對了，使用一或兩個高預測特徵的線性模型是不錯的起點。

預測獨角獸外觀極為困難。因此，請使用具備所有可用功能的深層類神經網路。

不正確。以複雜的模型來說，這會使偵錯作業變得複雜。

從簡單的線性模型開始，但使用所有功能以確保簡單的模型具有預測能力。

不正確。如果使用大量功能 (即使有線性模型)，則產生的模型會變得複雜且難以偵錯。

基準

使用迴歸平均誤差 (MSE) 的迴歸功能，就可以用乘車的時間長度、距離、出發地和終點預測計程車叫車的費用。你知道：

平均乘車費用為 $15 美元。
乘車費用會增加每公里固定金額。
位於市區的遊樂設施需額外付費。
乘車費用最低 $3 美元起。

判斷下列基準線是否實用。

這是很實用的基準：每次搭乘費用 $15 美元。

是

答對了，平均費用是很實用的基準。

否

不正確。始終預測平均值會導致 MSE 低於任何其他值。因此，根據這個基準測試模型，即可提供有意義的比較結果。

視乘車費用的標準差而定。

不正確。無論標準偏差值為何，乘車的平均費用是很實用的基準，因為相較於預測其他值，系統一律會預測平均值代表的 MSE 較低。

這個實用的基準：只使用時間長度和來源做為特徵的訓練模型。

是

不正確。只有在實際工作環境中完整驗證模型後，才能使用經過訓練的模型做為基準。此外，經過訓練的模型還需經過較簡單的基準驗證。

否

答對了，只有在模型完全在實際工作環境中完成驗證後，再使用經過訓練的模型做為基準。

這是個實用的基準線：乘車費用是每公里的乘車距離 (以公里為單位) 乘以每公里票價。

是

答對了，距離是決定乘車費用最重要的因素。因此，以距離為基準的基準線很實用。

否

不正確。距離是決定乘車費用最重要的因素。因此，以距離為基準的基準線很實用。

這是實用的基準線：每次搭乘費用為 $1 美元。因為模型必須一律超過此基準。如果模型未超過此基準，我們就能確定模型有錯誤。

是

不正確。這並不是有用的基準，因為一律錯誤。將模型與總是一律錯誤的基準進行比較。

否

答對了，這個基準對模型無用。

超參數

下列問題說明訓練分類器的相關問題。選擇可修正所描述問題的動作。

訓練損失為 0.24，驗證損失為 0.36。下列哪兩項做法可以降低訓練與驗證損失之間的差異？

確認訓練集和驗證集具有相同的統計資料屬性。

答對了，如果訓練集和驗證集具有不同的統計資料屬性，那麼訓練資料就無法協助預測驗證資料。

使用正規化以防止過度配適。

答對了，如果訓練損失小於驗證損失，則模型可能不適合訓練資料。正規化可避免過度配適。

增加訓練週期數。

不正確。如果訓練損失小於驗證損失，則模型通常會不適合訓練資料。增加訓練訓練週期只會提高過度配適。

降低學習率。

不正確。驗證損失超過訓練損失通常代表過度配適。變更學習率並不會減少過度配適。

您執行了上一個問題中描述的正確操作，現在您的訓練和驗證損失，在經過多個訓練週期後，從 1.0 下降到大約 0.24。以下哪一項行動可以進一步降低訓練損失？

增加類神經網路的深度和寬度。

答對了，如果在訓練許多訓練週期時，如果訓練損失維持在 0.24 分，則您的模型可能會缺少預測功能，因此無法進一步降低損失。增加模型的深度和寬度能讓模型產生額外的預測能力，進而減少訓練損失。

增加訓練週期數。

不正確。如果在訓練多個訓練週期後，訓練作業維持在 0.24 分，則繼續訓練模型不太可能導致訓練損失大幅減少。

提高學習率。

不正確。由於許多訓練週期的訓練損失並未減少，因此提高學習率可能無法降低最終的訓練損失。而是提高學習率可能會導致訓練不穩定，導致模型無法學習資料。

您在上一個問題中採取了正確行動，模型的訓練損失降低至 0.20。假設你需要大幅減少模型的訓練損失。您可以新增幾項具有預測能力的功能。但是，訓練損失仍在 0.20 左右波動。下列哪三個選項可以降低訓練的損失？

增加圖層的深度和寬度。

答對了，您的模型可能不夠瞭解新功能的預測信號。

增加訓練訓練週期。

不正確。如果模型的訓練損失在 0.20 左右波動，則增加訓練訓練週期數量可能會導致模型的訓練損失在 0.20 左右波動。

這些功能不會新增與現有特徵相關的資訊。請改用其他功能。

答對了，您使用的功能中存在由特徵編碼的預測信號可能存在。

降低學習率。

答對了，因為新增功能可能會使得問題變得更複雜。具體來說，損失的波動表示學習率過高，且模型接近最小值。降低學習率可以讓模型學習最低程度。

模型偵錯

解開損失曲線