圖片資料擷取

從 Earth Engine 取得圖像資料

如要將圖片資料從 Earth Engine 取得並儲存至 Google 雲端硬碟、Cloud Storage 或 Earth Engine 資產,您可以使用 Export,且工作會由 Earth Engine 全權處理。如果匯出工作有資源調度問題 (例如耗時超過一天、傳回記憶體或逾時錯誤),或是您已熟悉 Apache BeamSparkDask 等架構,可能會偏好本文所述的資料擷取方法。您可以使用 Google Cloud 工具 (例如 DataflowDataproc) 擴充這些架構中導入的工作流程。

具體來說,本指南會說明如何使用 getPixelscomputePixels 手動提出圖像資料要求。在本例中,「圖片資料」是指具有一致縮放和投影的多維像素值陣列。區域、比例、投影和/或維度會在要求中指定。ImageFileFormat 頁面會列出可能的輸出格式。輸出目的地包括 Cloud Storage 或任何本機掛載的目錄。手動要求會增加複雜度,但可擴充至更大的工作負載。

從現有素材資源取得圖片資料

使用 getPixels 取得現有 Earth Engine 資產的圖片資料。您可以直接將素材資源 ID 傳送至要求,因此在擷取像素之前,您無法對像素執行任何運算。系統會傳回指定區域、比例、投影和格式的像素區塊。以下範例說明如何使用 getPixels 從 MODIS 圖像集合中取得 NDVI 時間序列。

從已計算的圖片取得圖片資料

使用 computePixels 從已計算的圖片 (例如複合圖片) 取得圖片資料。使用 computePixels,您可以透過 expression 參數傳遞計算的 ee.Image 物件。系統會傳回指定區域、比例、投影和格式的計算像素區塊。以下範例說明如何從無雲 Sentinel-2 組合圖中取得多光譜資料區塊。

手動並行處理要求

雖然您可以針對任何用途在任何數量的資料中提出要求,但建議您為較大的工作流程並行處理要求。如要同時提出許多這類要求,請使用 Earth Engine 高容量端點。您可以設定的並行要求數量,取決於並行互動要求配額。如要進一步瞭解何時使用大量傳輸量端點,請參閱 Earth Engine 大量傳輸量頁面

多執行緒

您可以使用執行緒來提出並行要求。getPixelscomputePixels 範例筆記本會示範這項做法。

Apache Beam

您可以使用 Apache Beam 管道將要求並行處理。這些管道可在本機上執行,也可以做為 Google Dataflow 工作執行。如需範例,請參閱 這門 Geo for Good 訓練課程這項人類、地球和 AI 示範。其他並行處理程式庫包括 DaskApache Spark