減輕損失:疊代方法

先前的單元介紹了損失的概念。在本單元中,您將瞭解 機器學習模型如何反覆減少損失

疊代學習可能會提醒您「熱和冷」兒童的遊戲,尋找隱藏的物體,如模擬圖。在此遊戲中,「隱藏物件」是最佳模型。您會先進行極度猜測 (「 \(w_1\) 的值為 0.」),然後等待系統判斷損失為何。然後,您還要做一下其他猜測 (「 \(w_1\) 的值為 0.5.」),看看會有什麼損失。,,會比較溫和。事實上,如果你能正確玩這款遊戲,通常就會比較暖。遊戲的真正秘訣就是 盡可能以最有效的方式找出最佳模型

下圖說明機器學習演算法在訓練模型時使用的疊代和錯誤程序:

從特徵與標籤移至模型和預測的循環。

圖 1. 用來訓練模型的疊代方法。

我們會在機器學習密集課程中使用相同的疊代方法,並詳細說明各種小工具,尤其是在標為「模型 (預測函式)」的風暴雲端中。疊代策略在機器學習中非常普遍,主要是因為其擴充方式適合大型資料集。

「模型」會將一或多項特徵做為輸入內容,並傳回一項預測結果做為輸出結果。為了簡化,請考慮採用一項特徵 (\(x_1\)) 並傳回一項預測 (\(y'\)) 的模型:

$$ y' = b + w_1x_1 $$

應為 \(b\)和 \(w_1\)設定哪些初始值?若是線性迴歸問題,則起始值不重要。我們可以隨機挑選值,但直接採用下列複雜值:

  • \(b\) = 0
  • \(w_1\) = 0

假設第一個特徵值是 10。將該特徵值插入預測函式會產生:

$$ y' = 0 + 0 \cdot 10 = 0 $$

圖表的「Compute Loss」部分是模型將使用的損失函式。假設我們使用平方損失函式。損失函式接受兩個輸入值:

  • \(y'\):模型對特徵的預測 x
  • \(y\):與地圖項目 x 對應的正確標籤。

我們最後已介紹圖中的「Compute 參數更新」部分。其中的機器學習系統會檢查損失函式的值,並產生 \(b\) 和 \(w_1\)的新值。現在,只要假設這個神秘的方塊設計出新值,接著機器學習系統會重新評估所有這些標籤,為損失函式產生新值,並產生新的參數值。我們會持續不斷學習,直到演算法發現模型參數的可能性降到最低。您通常會持續疊代,直到整體損失停止發生變化,或至少做出極慢的變更。發生這種情況時,假設模型已「收斂」