生產環境機器學習系統

機器學習比單純導入機器學習演算法來得多。 實際執行機器學習系統包含大量元件。

可用於實際工作環境的機器學習系統

機器學習系統圖表,只顯示
包含以下元件的機器學習系統圖表:資料收集、特徵擷取、程序管理工具、資料驗證、設定、機器資源管理、監控和提供基礎架構,以及機器學習程式碼。圖表中的機器學習程式碼部分顯示了其他九項元件。
  • 不,您無須自行建構。
    • 盡可能重複使用通用機器學習系統元件。
    • Google CloudML 解決方案包括 Dataflow 與 TF Serving
    • 您也可以在 Spark、Hadoop 等其他平台中找到元件。
    • 如何判斷需求?
      • 瞭解機器學習系統的典範和

影片講座摘要

機器學習密集課程截至目前為止,主要著重於建構機器學習模型。然而,如下圖所示,實際實際工作環境的機器學習系統是整個生態系統,其模型只是單一零件。

包含以下元件的機器學習系統圖表:資料收集、特徵擷取、程序管理工具、資料驗證、設定、機器資源管理、監控和提供基礎架構,以及機器學習程式碼。圖表中的機器學習程式碼部分顯示了其他九項元件。

圖 1. 實際生產環境中的機器學習系統。

機器學習程式碼是實際機器學習生產系統的核心,但這個方塊通常僅佔整個機器學習生產系統整體程式碼的 5% 或更少。(應該不是藍圖)。 請注意,機器學習生產系統投入大量資源來輸入資料:收集資料、驗證,以及從資料中擷取特徵。另外請注意,必須採用供應基礎架構,才能將機器學習模型的預測結果實際應用在實際用途。

幸好,上圖中的許多元件都可以重複使用。此外,您不需要自行建構圖 1 中的所有元件。

TensorFlow Extended (TFX) 是端對端平台,用於部署生產環境中的機器學習管線。

後續的模組將協助您在設計實際工作環境機器學習系統時,考量您的設計決策。