Ta strona została przetłumaczona przez Cloud Translation API.

Tworzenie łącznika treści

Łącznik treści to program służący do przeglądania danych w repozytorium firmy i wypełniania źródła danych. Google oferuje następujące opcje tworzenia oprogramowania sprzęgającego treści:

Pakiet SDK Content Connector. Jest to dobra opcja, jeśli programujesz w języku Java. Pakiet Content Connector SDK to otoka interfejsu API REST, która umożliwia szybkie tworzenie oprogramowania sprzęgającego. Informacje o tym, jak utworzyć łącznik treści za pomocą pakietu SDK, znajdziesz w sekcji Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector.
interfejsu API typu REST lub bibliotek interfejsów API niskiego poziomu; Użyj tych opcji, jeśli nie programujesz w języku Java albo jeśli Twoja baza kodu lepiej obsługuje interfejs API REST lub bibliotekę. Aby utworzyć oprogramowanie sprzęgające treści za pomocą interfejsu API REST, zapoznaj się z sekcją Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST.

Typowy łącznik treści wykonuje te zadania:

Odczytuje i przetwarza parametry konfiguracji.
Pobiera dyskretne fragmenty danych dostępnych do indeksowania, tzw. „items”, z zewnętrznego repozytorium treści.
Łączy listy kontroli dostępu, metadane i dane o treści w elementy możliwe do indeksowania.
Indeksuje elementy do źródła danych Cloud Search.
(opcjonalnie) Nasłuchuje zmian powiadomień z repozytorium treści innych firm. Powiadomienia o zmianach są konwertowane na żądania indeksowania, aby zapewnić synchronizację źródła danych Cloud Search z repozytorium innej firmy. Oprogramowanie sprzęgające wykonuje to zadanie tylko wtedy, gdy repozytorium obsługuje wykrywanie zmian.

Utwórz oprogramowanie sprzęgające treści za pomocą pakietu SDK Content Connector.

W poniższych sekcjach znajdziesz informacje o tym, jak utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK Content Connector.

Skonfiguruj zależności

Aby korzystać z pakietu SDK, musisz umieścić w pliku kompilacji pewne zależności. Kliknij kartę poniżej, aby wyświetlić zależności swojego środowiska kompilacji:

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

Gradle

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

Tworzenie konfiguracji oprogramowania sprzęgającego

Każde oprogramowanie sprzęgające ma plik konfiguracji zawierający parametry używane przez oprogramowanie sprzęgające, takie jak identyfikator repozytorium. Parametry są definiowane jako pary klucz-wartość, np. api.sourceId=1234567890abcdef.

Pakiet Google Cloud Search SDK zawiera kilka parametrów konfiguracyjnych dostarczonych przez Google, które są używane przez wszystkie oprogramowanie sprzęgające. W pliku konfiguracji musisz zadeklarować te parametry Google:

W przypadku oprogramowania sprzęgającego treści musisz zadeklarować api.sourceId i api.serviceAccountPrivateKeyFile, ponieważ te parametry identyfikują lokalizację repozytorium i klucz prywatny niezbędny do uzyskania dostępu do repozytorium.

W przypadku oprogramowania sprzęgającego tożsamości musisz zadeklarować api.identitySourceId, ponieważ ten parametr identyfikuje lokalizację zewnętrznego źródła tożsamości. Jeśli synchronizujesz użytkowników, musisz też zadeklarować api.customerId jako unikalny identyfikator konta Google Workspace swojej firmy.

Jeśli nie chcesz zastąpić domyślnych wartości innych parametrów dostarczonych przez Google, nie musisz ich deklarować w pliku konfiguracji. Więcej informacji o parametrach konfiguracyjnych dostarczonych przez Google, np. o sposobie generowania określonych identyfikatorów i kluczy, znajdziesz w sekcji Parametry konfiguracji dostarczone przez Google.

Możesz też zdefiniować własne parametry repozytorium do użycia w pliku konfiguracji.

Przekaż plik konfiguracji do oprogramowania sprzęgającego

Ustaw właściwość systemową config, aby przekazywać plik konfiguracji do oprogramowania sprzęgającego. Możesz ustawić właściwość za pomocą argumentu -D podczas uruchamiania oprogramowania sprzęgającego. Na przykład to polecenie uruchamia oprogramowanie sprzęgające od pliku konfiguracji MyConfig.properties:

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

Jeśli nie ma tego argumentu, pakiet SDK próbuje uzyskać dostęp do domyślnego pliku konfiguracji o nazwie connector-config.properties.

Określanie strategii przemierzania

Podstawową funkcją oprogramowania sprzęgającego treści jest przemierzanie repozytorium i zindeksowanie jego danych. Musisz wdrożyć strategię przemierzania na podstawie rozmiaru i układu danych w repozytorium. Możesz opracować własną strategię lub wybrać jedną z poniższych strategii wdrożonych w pakiecie SDK:

Strategia przemierzania wszystkich stron

Strategia pełnego przemierzania skanuje całe repozytorium i ślepo indeksuje każdy element. Ta strategia jest zwykle używana w przypadku małego repozytorium i kosztu pełnego przemierzania za każdym razem podczas indeksowania.

Ta strategia przemierzania sprawdza się w przypadku małych repozytoriów zawierających głównie statyczne, niehierarchiczne dane. Tej strategii możesz też użyć, gdy wykrywanie zmian jest trudne lub nie jest obsługiwane przez repozytorium.

Strategia przemierzania listy

Strategia przemierzania listy skanuje całe repozytorium, w tym wszystkie węzły podrzędne, sprawdzając stan każdego elementu. Następnie oprogramowanie sprzęgające przechodzi drugi etap i indeksuje tylko te elementy, które są nowe lub zostały zaktualizowane od ostatniego indeksowania. Ta strategia jest zwykle używana do wykonywania przyrostowych aktualizacji istniejącego indeksu (zamiast wykonywania pełnego przemierzania za każdym razem, gdy aktualizujesz indeks).

Ta strategia przemierzania jest odpowiednia, gdy wykrywanie zmian jest trudne lub nie jest obsługiwane przez repozytorium, masz dane niehierarchiczne i pracujesz z bardzo dużymi zbiorami danych.

Poruszanie się po wykresie

Strategia przemierzania wykresu skanuje cały węzeł nadrzędny, sprawdzając stan każdego elementu. Następnie oprogramowanie sprzęgające sprawdza drugi przebieg i indeksuje tylko elementy w węźle głównym, które są nowe lub zostały zaktualizowane od ostatniego indeksowania. Na koniec oprogramowanie sprzęgające przekazuje wszystkie identyfikatory podrzędne, a następnie indeksuje elementy w węzłach podrzędnych, które są nowe lub zostały zaktualizowane. Oprogramowanie sprzęgające jest kontynuowane rekurencyjnie po wszystkich węzłach podrzędnych, aż do rozwiązania wszystkich problemów. Takie przemierzanie jest zwykle stosowane w repozytoriach hierarchicznych, w których wyświetlanie wszystkich identyfikatorów nie jest praktyczne.

Ta strategia jest odpowiednia, jeśli masz dane hierarchiczne, które trzeba zindeksować, takie jak seria katalogów lub stron internetowych.

Każda z tych strategii przemierzania jest implementowana przez klasę oprogramowania sprzęgającego szablonu w pakiecie SDK. Możesz wdrożyć własną strategię przemierzania, ale szablony te znacznie przyspieszają tworzenie oprogramowania sprzęgającego. Aby utworzyć oprogramowanie sprzęgające za pomocą szablonu, przejdź do sekcji odpowiadającej Twojej strategii przemierzania:

Tworzenie oprogramowania sprzęgającego pełnego przemierzania za pomocą klasy szablonu
Tworzenie oprogramowania sprzęgającego przemierzania listy za pomocą klasy szablonu
Tworzenie oprogramowania sprzęgającego przemierzania wykresu za pomocą klasy szablonu

Utwórz oprogramowanie sprzęgające pełnego przemierzania za pomocą klasy szablonu

W tej sekcji dokumentacji opisujemy fragmenty kodu z przykładu FullTraversalSample.

Wdróż punkt wejścia oprogramowania sprzęgającego

Punktem wejścia do oprogramowania sprzęgającego jest metoda main(). Głównym zadaniem tej metody jest utworzenie instancji klasy Application i wywołanie jej metody start() w celu uruchomienia oprogramowania sprzęgającego.

Przed wywołaniem application.start() użyj klasy IndexingApplication.Builder do utworzenia instancji szablonu FullTraversalConnector. FullTraversalConnector akceptuje obiekt Repository, których metody implementujesz. Ten fragment kodu pokazuje, jak wdrożyć metodę main():

FullTraversalSample.java

Tworzenie łącznika treści

Utwórz oprogramowanie sprzęgające treści za pomocą pakietu SDK Content Connector.

Skonfiguruj zależności

Maven

Gradle

Tworzenie konfiguracji oprogramowania sprzęgającego

Przekaż plik konfiguracji do oprogramowania sprzęgającego

Określanie strategii przemierzania

Utwórz oprogramowanie sprzęgające pełnego przemierzania za pomocą klasy szablonu

Wdróż punkt wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Pobierz niestandardowe parametry konfiguracji

Wykonaj pełne przemierzanie

Ustaw uprawnienia dla elementu

Ustawianie metadanych elementu

Tworzenie elementu możliwego do zindeksowania

Umieść każdy element możliwy do zindeksowania w iteratorze

Dalsze kroki

Tworzenie oprogramowania sprzęgającego przemierzania listy za pomocą klasy szablonu

Wdróż punkt wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Pobierz niestandardowe parametry konfiguracji

Poruszaj się po liście

Przekaż identyfikatory elementów i wartości skrótu

Pobieranie i obsługa każdego produktu

Obsługa usuniętych elementów

Obsługa niezmienionych elementów

Ustaw uprawnienia dla elementu

Ustawianie metadanych elementu

Tworzenie elementu możliwego do zindeksowania

Dalsze kroki

Utwórz oprogramowanie sprzęgające przemierzania wykresu za pomocą klasy szablonu

Wdróż punkt wejścia oprogramowania sprzęgającego

Implementowanie interfejsu Repository

Pobierz niestandardowe parametry konfiguracji

Poruszaj się po wykresie

Przekaż identyfikatory elementów i wartości skrótu

Pobieranie i obsługa każdego produktu

Obsługa usuniętych elementów

Ustaw uprawnienia dla elementu

Ustawianie metadanych elementu

Tworzenie elementu możliwego do zindeksowania

Umieść identyfikatory podrzędne w kolejce indeksowania w Cloud Search

Dalsze kroki

Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST

Określanie strategii przemierzania

Wdrażanie strategii przemierzania i elementów indeksu

Obsługuj zmiany w repozytorium

Implementowanie interfejsu `Repository`

Implementowanie interfejsu `Repository`

Implementowanie interfejsu `Repository`