簡化正規化作業:驗收成果

L2 正規化

請參考下列選項。

假設有一個包含 100 個輸入特徵的線性模型:
  • 10 分表示非常豐富資訊。
  • 90 則不具資訊性。
  • 假設所有特徵的值都介於 -1 和 1 之間。以下敘述何者正確?
    L2 正則化會鼓勵許多非資訊化的權重幾乎 (但不一定) 0.0。
    是,L2 正則化建議將權重值設為 0.0 左右,而非 0.0。
    L2 正則化將建議大部分的非資訊性權重剛好為 0.0。
    L2 正則化通常不會強制將權重設為 0.0。L2 正則化的權重會比較小權重來得高。當權重接近 0.0 時,L2 的「推送」力量較少。
    L2 正則化可能會導致模型針對某些非資訊性特徵學習中等的權重。
    令人意外的是,如果非資訊豐富的地圖項目與該標籤有關聯,就可能發生這種情況。在這種情況下,模型會錯誤地將這類沒有資訊的特徵部分轉化為資訊型特徵,

    L2 正規化和關聯功能

    請參考下列選項。

    假設有一個線性模型具備兩個密切相關的特徵;也就是說,這兩個特徵幾乎完全相同,但其中一個地圖項目含有少量的隨機雜訊。如果使用 L2 正則化訓練這個模型,這兩項特徵的權重會有什麼影響?
    這兩項功能的權重大致相同,且相等。
    L2 正則化將強制特徵的權重約等於或只有兩種特徵的一半。
    一個特徵的權重較高,另一個地圖項目的權重「幾乎是」0.0。
    L2 正則化的權重會比較小權重來得高。因此,即使其中一個權重開始速度比另一個權重開始快,L2 正則化通常會強制讓較大的權重捨棄速度比較小的權重更快。
    一項地圖項目的權重較高,另一個則的權重「正」為 0.0。
    L2 正則化很少將權重強制設為 0.0。相較之下,L1 正則化 (稍後討論)「會」將權重強制設為 0.0。