本頁面由 Cloud Translation API 翻譯而成。

建立內容連接器

內容連接器是一種軟體程式，可遍歷企業存放區中的資料，並填入資料來源。Google 提供下列開發內容連結器的選項：

內容連接器 SDK。如果您使用 Java 程式設計，這是個不錯的選擇。Content Connector SDK 是 REST API 的包裝函式，可讓您快速建立連接器。如要使用 SDK 建立內容連接器，請參閱「使用 Content Connector SDK 建立內容連接器」。
低階 REST API 或 API 程式庫。如果您不是以 Java 程式設計，或程式碼集更適合使用 REST API 或程式庫，請使用這些選項。如要使用 REST API 建立內容連接器，請參閱「使用 REST API 建立內容連接器」。

一般來說，內容連結器會執行下列工作：

讀取及處理設定參數。
從第三方內容存放區提取可建立索引的離散資料區塊，稱為「項目」。
將 ACL、中繼資料和內容資料合併為可建立索引的項目。
為 Cloud Search 資料來源中的項目建立索引。
(選用) 監聽第三方內容存放區的變更通知。變更通知會轉換為索引要求，確保 Cloud Search 資料來源與第三方存放區保持同步。只有在存放區支援變更偵測時，連接器才會執行這項工作。

使用 Content Connector SDK 建立內容連接器

以下各節說明如何使用 Content Connector SDK 建立內容連結器。

設定依附元件

如要使用 SDK，您必須在建構檔案中加入特定依附元件。按一下下方的分頁標籤，即可查看建構環境的依附元件：

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

Gradle

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

建立連接器設定

每個連接器都有一個設定檔，內含連接器使用的參數，例如存放區的 ID。參數定義為鍵/值組合，例如 api.sourceId=1234567890abcdef。

Google Cloud Search SDK 包含多個 Google 提供的設定參數，所有連接器都會使用這些參數。您必須在設定檔中宣告下列 Google 提供的參數：

如果是內容連接器，您必須宣告 api.sourceId 和 api.serviceAccountPrivateKeyFile，因為這些參數會識別存放區的位置，以及存取存放區所需的私密金鑰。

如果是身分識別連接器，您必須宣告 api.identitySourceId，因為這個參數會識別外部身分識別來源的位置。如果您要同步處理使用者，也必須將 api.customerId 宣告為企業 Google Workspace 帳戶的專屬 ID。

除非您想覆寫其他 Google 提供的參數預設值，否則不需要在設定檔中宣告這些參數。如要進一步瞭解 Google 提供的設定參數，例如如何產生特定 ID 和金鑰，請參閱「Google 提供的設定參數」。

您也可以定義自己的存放區專屬參數，供設定檔使用。

將設定檔傳遞至連接器

設定系統屬性 config，將設定檔傳遞至連接器。啟動連接器時，您可以使用 -D 引數設定屬性。舉例來說，下列指令會使用 MyConfig.properties 設定檔啟動連接器：

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

如果缺少這個引數，SDK 會嘗試存取名為 connector-config.properties 的預設設定檔。

決定遍歷策略

內容連結器的主要功能是遍歷存放區並為資料建立索引。您必須根據存放區中資料的大小和版面配置，實作遍歷策略。您可以自行設計策略，也可以選擇 SDK 中導入的下列策略：

完整遍歷策略

完整遍歷策略會掃描整個存放區，並盲目為每個項目建立索引。如果您擁有小型存放區，且每次建立索引時都能負擔完整遍歷的負擔，通常會使用這項策略。

這種遍歷策略適合用於小型存放區，其中大多是靜態、非階層式資料。如果變更偵測功能難以使用或存放區不支援，您也可以使用這項遍歷策略。

清單遍歷策略

清單遍歷策略會掃描整個存放區 (包括所有子節點)，判斷每個項目的狀態。接著，連接器會進行第二次傳遞，只為上次建立索引後新增或更新的項目建立索引。這項策略通常用於對現有索引執行增量更新 (不必在每次更新索引時進行完整遍歷)。

如果存放區難以偵測變更或不支援偵測變更，且您有非階層式資料，並處理非常龐大的資料集，就適合採用這種遍歷策略。

圖形遍歷

圖形遍歷策略會掃描整個父項節點，判斷每個項目的狀態。接著，連接器會進行第二次傳遞，只為根節點中自上次建立索引後新增或更新的項目建立索引。最後，連接器會傳遞任何子項 ID，然後為新節點或已更新節點中的項目建立索引。連接器會繼續以遞迴方式處理所有子節點，直到所有項目都處理完畢為止。這類遍歷通常用於階層式存放區，列出所有 ID 並不實際。

如果您有需要檢索的階層式資料 (例如一系列目錄或網頁)，就適合採用這項策略。

SDK 中的範本連接器類別會實作這些遍歷策略。雖然您可以實作自己的遍歷策略，但這些範本可大幅加快連接器的開發速度。如要使用範本建立連接器，請前往與您的遍歷策略對應的章節：

使用範本類別建立完整遍歷連接器
使用範本類別建立清單遍歷連接器
使用範本類別建立圖形遍歷連接器

使用範本類別建立完整遍歷的連接器

本文件這一節會參考 FullTraversalSample 範例中的程式碼片段。

實作連接器的進入點

連接器的進入點是 main() 方法。這個方法的主要工作是建立 Application 類別的例項，並叫用其 start() 方法來執行連接器。

呼叫 application.start() 前，請使用 IndexingApplication.Builder 類別例項化 FullTraversalConnector 範本。FullTraversalConnector 接受您實作方法的 Repository 物件。下列程式碼片段說明如何實作 main() 方法：

FullTraversalSample.java

建立內容連接器 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

使用 Content Connector SDK 建立內容連接器

設定依附元件

Maven

Gradle

建立連接器設定

將設定檔傳遞至連接器

決定遍歷策略

使用範本類別建立完整遍歷的連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行完整遍歷

設定項目的權限

設定項目的中繼資料

建立可建立索引的項目

將每個可建立索引的項目封裝在疊代器中

後續步驟

使用範本類別建立清單遍歷連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行清單遍歷

推送項目 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

處理未變更的項目

設定項目的權限

設定項目的中繼資料

建立可建立索引的項目

後續步驟

使用範本類別建立圖形遍歷連接器

實作連接器的進入點

實作 Repository 介面

取得自訂設定參數

執行圖形遍歷

推送項目 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

設定項目的權限

設定項目的中繼資料

建立可建立索引的項目

將子項 ID 放入 Cloud Search 索引佇列

後續步驟

使用 REST API 建立內容連接器

決定遍歷策略

實作遍歷策略並為項目建立索引

處理存放區變更

建立內容連接器

實作 `Repository` 介面

實作 `Repository` 介面

實作 `Repository` 介面