Questa pagina è stata tradotta dall'API Cloud Translation.

Crea un connettore di contenuti

Un connettore di contenuti è un programma software utilizzato per attraversare i dati in un repository aziendale e completare un'origine dati. Google offre le seguenti opzioni per lo sviluppo dei connettori di contenuti:

L'SDK del connettore di contenuti. Questa è una buona opzione se stai programmando in Java. L'SDK Content Connector è un wrapper attorno all'API REST che consente di creare rapidamente i connettori. Per creare un connettore di contenuti utilizzando l'SDK, consulta la pagina Creare un connettore di contenuti utilizzando l'SDK di Content Connector.
API REST o librerie API di basso livello. Usa queste opzioni se non stai programmando in Java o se il tuo codebase supporta meglio un'API REST o una libreria. Per creare un connettore di contenuti utilizzando l'API REST, consulta Creare un connettore di contenuti utilizzando l'API REST.

Un tipico connettore di contenuti esegue le seguenti attività:

Legge ed elabora i parametri di configurazione.
Estrae blocchi discreti di dati indicizzabili, chiamati "items", dal repository di contenuti di terze parti.
Combina ACL, metadati e dati sui contenuti in elementi indicizzabili.
Indicizza gli elementi nell'origine dati di Cloud Search.
(Facoltativo) Ascolta le notifiche delle modifiche dal repository di contenuti di terze parti. Le notifiche di modifica vengono convertite in richieste di indicizzazione per mantenere sincronizzata l'origine dati di Cloud Search con il repository di terze parti. Il connettore esegue questa attività solo se il repository supporta il rilevamento delle modifiche.

Creare un connettore di contenuti utilizzando l'SDK di Content Connector

Le seguenti sezioni spiegano come creare un connettore di contenuti utilizzando l'SDK del connettore di contenuti.

configura le dipendenze

Per utilizzare l'SDK, devi includere determinate dipendenze nel file di build. Fai clic su una scheda in basso per visualizzare le dipendenze per l'ambiente di build:

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

Gradle

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

Crea la configurazione del connettore

Ogni connettore ha un file di configurazione contenente i parametri utilizzati dal connettore, ad esempio l'ID del repository. I parametri sono definiti come coppie chiave-valore, ad esempio api.sourceId=1234567890abcdef.

L'SDK Google Cloud Search contiene diversi parametri di configurazione forniti da Google utilizzati da tutti i connettori. Devi dichiarare i seguenti parametri forniti da Google nel file di configurazione:

Per un connettore di contenuti, devi dichiarare api.sourceId e api.serviceAccountPrivateKeyFile poiché questi parametri identificano la posizione del repository e la chiave privata necessaria per accedere al repository.

Per un connettore di identità, devi dichiarare api.identitySourceId poiché questo parametro identifica la località dell'origine identità esterna. Se esegui la sincronizzazione degli utenti, devi anche dichiarare api.customerId come ID univoco dell'account Google Workspace della tua azienda.

A meno che tu non voglia sostituire i valori predefiniti di altri parametri forniti da Google, non è necessario dichiararli nel file di configurazione. Per saperne di più sui parametri di configurazione forniti da Google, ad esempio su come generare determinati ID e chiavi, consulta la sezione Parametri di configurazione forniti da Google.

Puoi anche definire parametri specifici per il repository da utilizzare nel file di configurazione.

Passa il file di configurazione al connettore

Imposta la proprietà di sistema config in modo da passare il file di configurazione al connettore. Puoi impostare la proprietà utilizzando l'argomento -D quando avvii il connettore. Ad esempio, il comando seguente avvia il connettore con il file di configurazione MyConfig.properties:

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

Se questo argomento non è presente, l'SDK tenta di accedere a un file di configurazione predefinito denominato connector-config.properties.

Definisci la tua strategia di attraversamento

La funzione principale di un connettore di contenuti è attraversare un repository e indicizzarne i dati. Devi implementare una strategia di attraversamento in base alle dimensioni e al layout dei dati nel tuo repository. Puoi creare la tua strategia o scegliere tra le seguenti strategie implementate nell'SDK:

Strategia di attraversamento completo

Una strategia di attraversamento completa esegue la scansione dell'intero repository e indicizza in modo invisibile ogni elemento. Questa strategia viene di solito utilizzata quando hai un repository di piccole dimensioni e può permetterti di gestire un attraversamento completo a ogni indicizzazione.

Questa strategia di attraversamento è adatta per repository di piccole dimensioni con dati per lo più statici e non gerarchici. Puoi utilizzare questa strategia di attraversamento anche quando il rilevamento delle modifiche è difficile o non è supportato dal repository.

Strategia di attraversamento elenco

Una strategia di attraversamento elenco analizza l'intero repository, inclusi tutti i nodi figlio, determinando lo stato di ogni elemento. Poi, il connettore esegue un secondo passaggio e indicizza solo gli elementi nuovi o che sono stati aggiornati dall'ultima indicizzazione. Questa strategia di solito viene utilizzata per eseguire aggiornamenti incrementali a un indice esistente (anziché dover eseguire un attraversamento completo ogni volta che aggiorni l'indice).

Questa strategia di attraversamento è adatta quando il rilevamento delle modifiche è difficile o non è supportato dal repository, disponi di dati non gerarchici e lavori con set di dati di grandi dimensioni.

Attraversamento grafico

Una strategia di attraversamento grafico esegue la scansione dell'intero nodo padre determinando lo stato di ogni elemento. Quindi, il connettore esegue un secondo passaggio e indicizza solo gli elementi nel nodo radice sono nuovi o sono stati aggiornati dall'ultima indicizzazione. Infine, il connettore passa tutti gli ID figlio e quindi indicizza gli elementi nuovi o aggiornati nei nodi secondari. Il connettore continua in modo ricorsivo attraverso tutti i nodi secondari fino a quando non vengono corretti tutti gli elementi. Questo attraversamento viene generalmente utilizzato per i repository gerarchici in cui l'elenco di tutti gli ID non è pratico.

Questa strategia è adatta se hai dati gerarchici che devono essere sottoposti a scansione, come una serie di directory o pagine web.

Ognuna di queste strategie di attraversamento viene implementata da una classe di connettore modello nell'SDK. Sebbene tu possa implementare la tua strategia di attraversamento, questi modelli velocizzano notevolmente lo sviluppo del connettore. Per creare un connettore utilizzando un modello, vai alla sezione corrispondente alla tua strategia di attraversamento:

Crea un connettore attraversamento completo utilizzando una classe di modello
Crea un connettore di attraversamento elenco utilizzando una classe di modello
Crea un connettore di attraversamento grafico utilizzando una classe di modello

Crea un connettore attraversamento completo utilizzando una classe di modello

Questa sezione della documentazione fa riferimento agli snippet di codice dell'esempio FullTraversalSample.

Implementare il punto di ingresso del connettore

Il punto di ingresso a un connettore è il metodo main(). L'attività principale di questo metodo è creare un'istanza della classe Application e richiamare il relativo metodo start() per eseguire il connettore.

Prima di chiamare application.start(), utilizza la classe IndexingApplication.Builder per creare un'istanza del modello FullTraversalConnector. L'oggetto FullTraversalConnector accetta un oggetto Repository di cui implementi i metodi. Il seguente snippet di codice mostra come implementare il metodo main():

FullTraversalSample.java

Crea un connettore di contenuti

Creare un connettore di contenuti utilizzando l'SDK di Content Connector

configura le dipendenze

Maven

Gradle

Crea la configurazione del connettore

Passa il file di configurazione al connettore

Definisci la tua strategia di attraversamento

Crea un connettore attraversamento completo utilizzando una classe di modello

Implementare il punto di ingresso del connettore

Implementare l'interfaccia di Repository

Ottieni parametri di configurazione personalizzati

Esegui un attraversamento completo

Impostare le autorizzazioni per un elemento

Impostare i metadati per un elemento

Crea l'elemento indicizzabile

Raggruppa ogni elemento indicizzabile in un iteratore

Passaggi successivi

Crea un connettore di attraversamento elenco utilizzando una classe di modello

Implementare il punto di ingresso del connettore

Implementare l'interfaccia di Repository

Ottieni parametri di configurazione personalizzati

Esegui il attraversamento elenco

Esegui il push di ID elemento e valori hash

Recupera e gestisci ogni elemento

Gestire gli elementi eliminati

Gestire gli elementi non modificati

Impostare le autorizzazioni per un elemento

Impostare i metadati per un elemento

Crea un elemento indicizzabile

Passaggi successivi

Crea un connettore di attraversamento grafico utilizzando una classe di modello

Implementare il punto di ingresso del connettore

Implementare l'interfaccia di Repository

Ottieni parametri di configurazione personalizzati

Eseguire l'attraversamento del grafico

Esegui il push di ID elemento e valori hash

Recupera e gestisci ogni elemento

Gestire gli elementi eliminati

Impostare le autorizzazioni per un elemento

Impostare i metadati per un elemento

Crea l'elemento indicizzabile

Inserisci gli ID secondari nella coda di indicizzazione di Cloud Search

Passaggi successivi

Creare un connettore di contenuti utilizzando l'API REST

Definisci la tua strategia di attraversamento

Implementa la strategia di attraversamento e l'indicizzazione degli elementi

Gestire le modifiche al repository

Implementare l'interfaccia di `Repository`

Implementare l'interfaccia di `Repository`

Implementare l'interfaccia di `Repository`