Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

解決機器學習問題

根據預測結果判斷問題最好的方式您現在已準備好用機器學習術語來構思問題。完成下列工作，即可依據機器學習術語找出問題：

定義理想的結果和模型的目標。
識別模型的輸出內容。
定義成效指標。

定義理想的結果和模型的目標

未採用機器學習模型，理想的結果為何？也就是例如您希望產品或功能執行的確切工作原來是先前在說明目標一節中定義的語句專區。

藉由明確定義讓模型執行下表說明理想的結果，假設模型的目標：

應用程式	理想成果	模型的目標
「天氣」應用程式	以六小時為單位計算地理區域的降水量。	預測特定地理區域的六小時降水量。
時尚應用程式	產生各種襯衫設計。	根據文字和圖片生成三種襯衫設計其中文字會指出樣式和顏色，而圖片則是襯衫 (T 恤、鈕扣、馬球)。
影片應用程式	推薦實用影片。	預測使用者是否點選影片。
郵件應用程式	偵測垃圾內容。	預測電子郵件是否為垃圾郵件。
金融應用程式	摘要列出多個新聞來源的財經資訊。	根據 Google Cloud 業務中。
地圖應用程式	計算交通時間。	預測兩點之間移動所需時間。
銀行應用程式	識別詐欺交易。	預測持卡人是否完成交易。
用餐應用程式	依據餐廳的菜單辨識料理。	預測餐廳類型。
電子商務應用程式	生成關於公司產品的客戶服務回覆。	運用情緒分析和機構的知識庫

找出需要的輸出內容

要選擇的模型類型取決於問題。模型的輸出內容應會完成找出理想結果因此，第一個要回答的問題是「使用哪種輸出方式解決我的問題？」

如果需要分類或進行數值預測也能使用預測式機器學習如果需要產生新內容或這可能會使用生成式 AI

下表列出預測式機器學習和生成式 AI 輸出內容：

**表 1.** 預測機器學習
	機器學習系統	輸出範例
分類	二進位數	將電子郵件分類為垃圾郵件或非垃圾郵件。
	多類別單一標籤	將圖片中的動物分類。
	多類別多標籤	將圖片中的所有動物分類。
數值	單維迴歸	預測影片獲得的觀看次數。
數值	多維度迴歸	預測血壓、心率和膽固醇濃度模型

**表 2.** 生成式 AI
模型類型	輸出範例
文字	提供文章重點摘要。回覆顧客評論。將文件從英文翻譯成中文。撰寫產品說明。分析法律文件。
圖片	產生行銷圖片。為相片套用視覺效果。產生產品設計變化版本。
音訊	以特定口音產生對話。生成短音樂作品等特定類型的音樂，例如爵士樂。
視訊	生成逼真的影片。分析影片片段並套用視覺效果。
多模態	產生多種類型的輸出內容，例如含有字幕的影片。

分類

分類模型 預測輸入資料屬於哪個類別，例如輸入內容應歸類為 A、B 或 C。

分類模型正在進行預測。

圖 1. 進行預測的分類模型。

應用程式可能會根據模型的預測結果做出決定。舉例來說預測結果是類別 A，然後執行 X；如果預測值是 B 類別，則 do、Y；如果預測結果是類別 C，則務必 Z。在某些情況下是應用程式的輸出內容。

產品程式碼會使用模型的輸出內容做出決定。

圖 2. 在產品程式碼中使用分類模型輸出內容做出決定

迴歸

迴歸模型可預測也就是數值

迴歸模型正在進行預測，

圖 3. 進行數字預測的迴歸模型。

應用程式可能會根據模型的預測結果做出決定。舉例來說預測結果落在 A 範圍之內，執行 X如果預測值落在範圍內 B，做 Y；如果預測結果落在 C 範圍內，就應該 Z。在某些情況下，預測「是」應用程式的輸出內容。

產品程式碼會使用模型的輸出內容做出決定。

圖 4. 產品程式碼中使用迴歸模型的輸出內容做出決策

請參考下列情境：

您想要快取根據預測的熱門程度搜尋影片也就是說預測影片將會很受歡迎，所以您可能會想快速向使用者提供影片。目的地：如此一來，您就可以使用更有效且昂貴的快取。至於其他影片使用不同的快取您的快取條件如下：

如果影片預計可獲得 50 次以上觀看次數，則不用付費快取。
假設系統預測影片觀看次數介於 30 到 50 次之間，您就可以選用快取。
如果影片預計獲得不到 30 次觀看，您就不會快取影片。

你認為迴歸模型是正確的做法數值，也就是觀看次數。但在訓練迴歸模型時就會發現兩者產生的預測結果 28 和 32的損失觀看次數達 30 次的影片換句話說，雖然您的應用程式當預測結果是 28 與 32 時，模型會同時考量兩者而且預測結果一樣好

正在訓練模型並評估其損失。

圖 5. 訓練迴歸模型。

迴歸模型不知道產品定義的門檻。因此，如果您的應用程式的行為會大幅改變，因為迴歸模型預測分類模型

在這種情況下，分類模型就會產生正確的行為因為分類模型的預測 28 比 32。理論上，分類模型預設會產生門檻。

本情境強調兩個重點：

預測決策。請盡可能預測應用程式的取而代之在影片範例中，分類模型會預測偵測影片分類後是否會「沒有快取」"便宜快取」「高昂的快取」從模型中隱藏應用程式行為會導致應用程式產生錯誤的行為。
瞭解問題限制。如果您的應用程式使用會依據不同的門檻偵測動作固定或動態變動
- 動態門檻：如果閾值是動態的，請使用迴歸模型，並在應用程式的程式碼中設定閾值限制。方便您輕鬆使用更新門檻，同時讓模型預測結果
- 固定門檻：如果門檻固定，請使用分類模型並根據門檻限制為資料集加上標籤
一般來說，大部分的快取佈建作業都是動態的，且門檻會變動長期下來。由於這是快取問題迴歸模型是最佳選擇不過，在許多問題中使分類模型成為最佳解決方案

接著再舉一個例子。如果要建構的天氣應用程式最理想的結果是讓使用者知道接下來 6 小時內會下雨。您可以用迴歸模型來預測「precipitation_amount.」標籤

理想成果	理想標籤
告知使用者所在地區的降雨量在接下來的 6 小時	`precipitation_amount`

在天氣應用程式範例中，標籤會直接說明理想結果。但在某些情況下，一對一並加上理想結果和標籤以影片應用程式為例，理想的結果是推薦實用影片。但在名為 useful_to_user.

理想成果	理想標籤
推薦實用影片。	`?`

因此，您必須找出 Proxy 標籤。

Proxy 標籤

Proxy 標籤替代也就是不在資料集內的標籤直接測量想要預測的內容在影片應用程式中，我們無法評估使用者是否會覺得影片很實用如果資料集具有 useful 功能，使用者標示了自己找到的所有影片但由於資料集不需要，因此我們需要一個 Proxy 標籤以及實用性的替代方法

提供便利性的 Proxy 標籤能指出使用者會分享或按讚影片。

理想成果	Proxy 標籤
推薦實用影片。	`shared OR liked`

請謹慎使用 Proxy 標籤，因為這類標籤無法直接評估所需內容以便預測例如，下表概述了潛在的問題 推薦實用影片的 Proxy 標籤：

Proxy 標籤	問題
預測使用者是否點選「喜歡」按鈕。	大部分的使用者都不會按下「喜歡」。
預測影片是否熱門。	非個人化搜尋結果。部分使用者可能會不喜歡熱門影片。
預測使用者是否分享影片。	部分使用者不會分享影片。有時觀眾分享影片的原因他們「不喜歡」
預測使用者是否點選播放。	盡量提高誘餌式點擊。
預測觀眾觀看影片的時間長度。	比起短片，長片較喜歡長篇影片。
預測使用者再次觀看影片的次數。	喜好項目：「可重複觀看」不能重複觀看的影片類型更勝以往

沒有任何替代標籤能取代理想結果。所有人都將都可能發生潛在問題請挑選您最不容易問題的具體來說，您可以設計提示來解決業務工作

驗收學習成果

有一家公司想在健康與保健應用程式中使用機器學習技術，人們會覺得越來越好您認為他們需要使用 Proxy 標籤才能協助他們實現目標？

是的，公司必須尋找 Proxy 標籤。類別如下：無法直接衡量幸福和身心健康。他們必須與其他功能 (例如花費的時數) 視為約略值每週運動，或是從事嗜好或朋友互動的時間。

否，該公司不需要使用 Proxy 標籤。幸福與身心健康可直接衡量

代別

在多數情況下，您不需要訓練自己的生成式模型，因為這麼做的用意是需要大量的訓練資料和運算資源您將自訂預先訓練的生成式模型為了取得產生所需的輸出內容，您可能需要使用下列一或多項技巧：

精煉作業。如要建立並產生合成標籤資料集並使用較大型的模型來訓練較小型的模型生成式模型通常無害且耗用大量資源 (例如記憶體) 電費、電力) 和電力) 搭配。精煉作業可以用來建構規模較小、所需資源較少以估算大型模型的成效
微調或 高效調整參數：如要提升特定工作上的模型效能，您需要用來訓練模型，該資料集含有您的輸出類型範例想要製作的內容
提示工程：目的地：取得模型執行特定工作您要生成特定格式的輸出內容該如何執行或說明輸出結果的格式。也就是說提示可以包含如何執行工作的自然語言指示或舉例說明想輸出的內容

舉例來說，如果您想獲得文章摘要，可以在包括：
```
Produce 100-word summaries for each article.
```
如要讓模型產生特定讀物分級的文字那麼，您可以輸入：
```
All the output should be at a reading level for a 12-year-old.
```
如果您希望模型以特定格式提供輸出內容，您可以說明輸出內容的格式，例如「格式化或展示工作成果用自己的例子來說明舉例來說，您可以輸入以下內容：
```
Translate words from English to Spanish.

English: Car
Spanish: Auto

English: Airplane
Spanish: Avión

English: Home
Spanish:______
```

精煉與微調會更新模型的參數。提示工程模型的參數不會更新相反地，提示工程可以模型會學習如何根據提示內容生成所需的輸出內容

在某些情況下，您還需要 測試資料集來評估根據已知值對生成式模型輸出內容模型的摘要與人類生成的摘要相似模型的摘要品質也很好

生成式 AI 也能用來導入預測式機器學習例如分類或迴歸舉例來說，因為他們對自然語言有深厚的瞭解 大型語言模型 (LLM) 可能比預測式機器學習更能有效執行文字分類工作特定任務訓練而成

定義成效指標

定義您用來決定機器學習實作的指標代表成功。成效指標可以定義您重視的指標，例如參與度或協助使用者採取適當行動，例如觀看他們找到的影片很實用成效指標與模型的評估指標不同，例如 準確率、精確度、 喚回度，或 AUC。

舉例來說，天氣應用程式的成功和失敗指標可以定義為包括：

成功	使用者開啟「會下雨嗎？」產品特色
失敗	使用者開啟「會下雨嗎？」功能的頻率。

影片應用程式指標的定義可能如下：

成功	使用者在網站上停留的時間平均增加 20%。
失敗	相較於過去，使用者平均在網站上停留的時間不多。

建議您定義明確的成效指標。目標過高會造成資料缺口成功與失敗之間取得平衡舉例來說，使用者網站停留時間比以往多 10%，既不是成功，也沒有失敗。間隔未定義並不重要。

重要的是，模型能否更接近成功的定義舉例來說，分析模型的請思考以下問題：改善模型能否讓您獲得最貼近您訂定的成功標準？例如，模型可能但不會讓你更接近成功標準就算是完美的模型，還是無法達到另一方面，模型的評估指標可能偏低就接近成功標準，這意味著改善模型逐步邁向成功

以下是判斷模型是否價值時需考慮的維度改善：

非常好，但請繼續。模型不應用於但長期下來這個架構可能會大幅改善。
夠好了，請繼續。模型可用於正式環境也可能會精進
不錯，但無法再精益求精。模型處於正式環境但一定可以做到。
能力不足，永遠不會改變。模型不應用於而且不多進行的訓練都有機會達成這個目標

在決定改善模型時，請重新評估資源是否增加例如工程時間和運算成本模型

定義成功和失敗指標後，您需要決定多久進行評估例如，您可以測量成效指標六啟動系統後的 15 天、6 週或 6 個月。

在分析失敗指標時，請嘗試判斷系統失敗的原因。適用對象例如，模型可能預測使用者會點選哪些影片模型可能會開始建議使用者參與度提高點擊的誘餌式點擊標題落地生意。在天氣應用程式範例中，模型可能會準確預測可能會下雨，但地理區域過大

驗收學習成果

一家時尚公司想提高服飾銷售量。有人建議使用機器學習技術決定要製造哪件衣服。他們認為自己可以訓練模型來判斷衣服的類型。更新後訓練模型時，會想將模型套用至目錄各種衣服

他們該如何以機器學習術語來構思問題？

理想成果：決定要製造哪些產品。

模型的目標：預測哪些服飾文章出現在。

模型輸出：二進位分類、in_fashion、 not_in_fashion

成效指標：衣服銷量 70% 以上執行。

理想成果：判斷要訂購的布料和用品。

模型的目標：預測每個商品的製造量。

模型輸出：二進位分類、make、 do_not_make

成效指標：衣服銷量 70% 以上執行。

最佳成果並不是判斷需要多少材質和補給品順序。代表要判斷是否應製造特定項目。因此，目標未能正確排除目標

瞭解問題

實作模型

解決機器學習問題 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

定義理想的結果和模型的目標

找出需要的輸出內容

分類

迴歸

Proxy 標籤

驗收學習成果

代別

定義成效指標

驗收學習成果

解決機器學習問題