建立內容連接器

內容連接器是一種軟體程式，可遍歷企業存放區中的資料，並填入資料來源。Google 提供下列選項，供您開發內容連接器：

內容連接器 SDK。這個選項很適合 Java 程式設計師。這個 SDK 是 REST API 的包裝函式，可讓您快速建立連接器。如要使用 SDK 建立內容連接器，請參閱「使用 Content Connector SDK 建立內容連接器」。
低階 REST API 或 API 程式庫。如果您不使用 Java，或程式碼集更適合 REST API 或程式庫，請使用這些選項。如要使用 REST API 建立內容連接器，請參閱「使用 REST API 建立內容連接器」。

一般來說，內容連結器會執行下列工作：

讀取及處理設定參數。
從第三方存放區提取可建立索引的資料區塊，稱為「項目」。
將 ACL、中繼資料和內容資料合併為可建立索引的項目。
為 Cloud Search 資料來源中的項目建立索引。
(選用) 監聽存放區的變更通知。變更通知會轉換為索引要求，確保 Cloud Search 資料來源保持同步。只有在存放區支援變更偵測時，連接器才會執行這項工作。

使用 Content Connector SDK 建立內容連接器

以下各節說明如何使用 Content Connector SDK 建立內容連接器。

設定依附元件

在建構檔案中加入這些依附元件。

Maven

xml <dependency> <groupId>com.google.enterprise.cloudsearch</groupId> <artifactId>google-cloudsearch-indexing-connector-sdk</artifactId> <version>v1-0.0.3</version> </dependency>

Gradle

groovy compile group: 'com.google.enterprise.cloudsearch', name: 'google-cloudsearch-indexing-connector-sdk', version: 'v1-0.0.3'

建立連接器設定

每個連接器都會使用設定檔，設定存放區 ID 等參數。將參數定義為鍵/值組合，例如 api.sourceId=1234567890abcdef。

Google Cloud Search SDK 包含所有連結器的 Google 提供參數。您必須在設定檔中宣告下列項目：

內容連結器：宣告 api.sourceId 和 api.serviceAccountPrivateKeyFile。這些資訊會識別您的儲存庫，以及存取所需的私密金鑰。

身分識別連接器：宣告 api.identitySourceId，以識別外部身分識別來源。如要同步處理使用者，請一併宣告 api.customerId (Google Workspace 帳戶的專屬 ID)。

如要覆寫其他 Google 提供的參數預設值，請一併宣告這些參數。如要瞭解如何產生 ID 和金鑰，請參閱「Google 提供的參數」。

您也可以在設定檔中定義存放區專屬參數。

將設定檔傳遞至連接器

設定 config 系統屬性，傳遞設定檔。啟動連接器時，請使用 -D 引數。例如：

java -classpath myconnector.jar -Dconfig=MyConfig.properties MyConnector

如果省略這個引數，SDK 會嘗試使用本機目錄中名為 connector-config.properties 的檔案。

決定遍歷策略

內容連結器的主要功能是遍歷存放區並為資料建立索引。您必須根據存放區的大小和版面配置導入策略。您可以自行設計策略，也可以從 SDK 中選擇策略：

完整遍歷策略: 掃描整個存放區，並為每個項目建立索引。這項策略最適合小型存放區，因為您可以在每次建立索引時，負擔完整遍歷的額外負荷。適用於小型存放區，其中大多是靜態、非階層式資料，或難以偵測變更的存放區。
清單遍歷策略: 掃描整個存放區，判斷每個項目的狀態，然後只為新項目或更新項目建立索引。如果系統不支援變更偵測，請使用這項功能，針對大型非階層式索引進行增量更新。
圖形遍歷: 掃描父項節點，判斷當中項目的狀態，然後為該節點中的新項目或更新項目建立索引。然後遞迴處理子節點。如果存放區具有階層結構，列出所有 ID 並不實際，例如目錄結構或網站，請使用這項功能。

SDK 會在範本連接器類別中實作這些策略。這些範本可加快開發速度。如要使用範本，請參閱對應的章節：

使用範本類別建立完整遍歷連接器
使用範本類別建立清單遍歷連接器
使用範本類別建立圖形遍歷連接器

使用範本類別建立完整遍歷的連接器

本節會參考 FullTraversalSample 中的程式碼。

實作連接器進入點

進入點是 main() 方法。這會建立 Application 執行個體，並呼叫 start() 來執行連接器。

呼叫 application.start() 前，請使用 IndexingApplication.Builder 類別例項化 FullTraversalConnector 範本。這個範本會接受 Repository 物件。

FullTraversalSample.java

建立內容連接器 透過集合功能整理內容 你可以依據偏好儲存及分類內容。

使用 Content Connector SDK 建立內容連接器

設定依附元件

Maven

Gradle

建立連接器設定

將設定檔傳遞至連接器

決定遍歷策略

使用範本類別建立完整遍歷的連接器

實作連接器進入點

實作 Repository 介面

取得自訂設定參數

執行完整遍歷

設定項目的權限

設定項目的中繼資料

建立可建立索引的項目

將每個可建立索引的項目封裝在疊代器中

後續步驟

使用範本類別建立清單遍歷連接器

實作連接器進入點

實作 Repository 介面

執行清單遍歷

推送項目 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

處理未變更的項目

設定項目的權限

設定項目的中繼資料

建立可編列索引的項目

後續步驟

使用範本類別建立圖形遍歷連接器

實作連接器的進入點

實作 Repository 介面

執行圖形遍歷

推送項目 ID 和雜湊值

擷取及處理每個項目

處理已刪除的項目

設定中繼資料並建立項目

將子項 ID 放入索引佇列

使用 REST API 建立內容連接器

決定遍歷策略

實作遍歷策略並為項目建立索引

處理存放區變更

建立內容連接器