瞭解您的理解:模型偵錯

針對以下問題,請按一下您的選項以展開並查看答案。

模擬方法

您和好友 Mel 就像獨角獸一樣。事實上,您非常喜歡獨角獸,因此決定使用機器學習來預測獨角獸的外貌。您有一個包含 10,000 個獨角獸外觀的資料集。每次外觀時,資料集都會包含位置、時段、高度、溫度、濕度、人口密度、樹木遮蔽、彩虹和許多其他功能。

想要開始開發機器學習模型。下列何者是開始開發的好方法?
獨角獸常常在黎明與黃昏時出現。因此,請使用「時段」功能來建立線性模型。
答對了,使用一或兩個高預測特徵的線性模型是不錯的起點。
預測獨角獸外觀極為困難。因此,請使用具備所有可用功能的深層類神經網路。
不正確。以複雜的模型來說,這會使偵錯作業變得複雜。
從簡單的線性模型開始,但使用所有功能以確保簡單的模型具有預測能力。
不正確。如果使用大量功能 (即使有線性模型),則產生的模型會變得複雜且難以偵錯。

基準

使用迴歸平均誤差 (MSE) 的迴歸功能,就可以用乘車的時間長度、距離、出發地和終點預測計程車叫車的費用。 你知道:

  • 平均乘車費用為 $15 美元。
  • 乘車費用會增加每公里固定金額。
  • 位於市區的遊樂設施需額外付費。
  • 乘車費用最低 $3 美元起。

判斷下列基準線是否實用。

這是很實用的基準:每次搭乘費用 $15 美元。
答對了,平均費用是很實用的基準。
不正確。始終預測平均值會導致 MSE 低於任何其他值。因此,根據這個基準測試模型,即可提供有意義的比較結果。
視乘車費用的標準差而定。
不正確。無論標準偏差值為何,乘車的平均費用是很實用的基準,因為相較於預測其他值,系統一律會預測平均值代表的 MSE 較低。
這個實用的基準:只使用時間長度和來源做為特徵的訓練模型。
不正確。只有在實際工作環境中完整驗證模型後,才能使用經過訓練的模型做為基準。此外,經過訓練的模型還需經過較簡單的基準驗證。
答對了,只有在模型完全在實際工作環境中完成驗證後,再使用經過訓練的模型做為基準。
這是個實用的基準線:乘車費用是每公里的乘車距離 (以公里為單位) 乘以每公里票價。
答對了,距離是決定乘車費用最重要的因素。因此,以距離為基準的基準線很實用。
不正確。距離是決定乘車費用最重要的因素。因此,以距離為基準的基準線很實用。
這是實用的基準線:每次搭乘費用為 $1 美元。因為模型必須一律超過此基準。如果模型未超過此基準,我們就能確定模型有錯誤。
不正確。這並不是有用的基準,因為一律錯誤。將模型與總是一律錯誤的基準進行比較。
答對了,這個基準對模型無用。

超參數

下列問題說明訓練分類器的相關問題。選擇可修正所描述問題的動作。

訓練損失為 0.24,驗證損失為 0.36。下列哪兩項做法可以降低訓練與驗證損失之間的差異?
確認訓練集和驗證集具有相同的統計資料屬性。
答對了,如果訓練集和驗證集具有不同的統計資料屬性,那麼訓練資料就無法協助預測驗證資料。
使用正規化以防止過度配適。
答對了,如果訓練損失小於驗證損失,則模型可能不適合訓練資料。正規化可避免過度配適。
增加訓練週期數。
不正確。如果訓練損失小於驗證損失,則模型通常會不適合訓練資料。增加訓練訓練週期只會提高過度配適。
降低學習率。
不正確。驗證損失超過訓練損失通常代表過度配適。變更學習率並不會減少過度配適。
您執行了上一個問題中描述的正確操作,現在您的訓練和驗證損失,在經過多個訓練週期後,從 1.0 下降到大約 0.24。以下哪一項行動可以進一步降低訓練損失?
增加類神經網路的深度和寬度。
答對了,如果在訓練許多訓練週期時,如果訓練損失維持在 0.24 分,則您的模型可能會缺少預測功能,因此無法進一步降低損失。增加模型的深度和寬度能讓模型產生額外的預測能力,進而減少訓練損失。
增加訓練週期數。
不正確。如果在訓練多個訓練週期後,訓練作業維持在 0.24 分,則繼續訓練模型不太可能導致訓練損失大幅減少。
提高學習率。
不正確。由於許多訓練週期的訓練損失並未減少,因此提高學習率可能無法降低最終的訓練損失。而是提高學習率可能會導致訓練不穩定,導致模型無法學習資料。
您在上一個問題中採取了正確行動,模型的訓練損失降低至 0.20。假設你需要大幅減少模型的訓練損失。您可以新增幾項具有預測能力的功能。但是,訓練損失仍在 0.20 左右波動。下列哪三個選項可以降低訓練的損失?
增加圖層的深度和寬度。
答對了,您的模型可能不夠瞭解新功能的預測信號。
增加訓練訓練週期。
不正確。如果模型的訓練損失在 0.20 左右波動,則增加訓練訓練週期數量可能會導致模型的訓練損失在 0.20 左右波動。
這些功能不會新增與現有特徵相關的資訊。請改用其他功能。
答對了,您使用的功能中存在由特徵編碼的預測信號可能存在。
降低學習率。
答對了,因為新增功能可能會使得問題變得更複雜。具體來說,損失的波動表示學習率過高,且模型接近最小值。降低學習率可以讓模型學習最低程度。