İçerik bağlayıcı oluşturma

İçerik bağlayıcı, bir kurumsal depodaki verileri tarayan ve bir veri kaynağını dolduran bir yazılım programıdır. Google, içerik bağlayıcıları geliştirme konusunda aşağıdaki seçenekleri sunar:

İçerik Bağlayıcı SDK'sı. Bu, Java programcıları için iyi bir seçenektir. SDK, bağlayıcıları hızlı bir şekilde oluşturmanıza olanak tanıyan REST API'nin sarmalayıcısıdır. SDK'yı kullanarak içerik bağlayıcı oluşturmak için İçerik Bağlayıcı SDK'sını kullanarak içerik bağlayıcı oluşturma başlıklı makaleyi inceleyin.
Düşük düzeyli bir REST API veya API kitaplıkları. Java kullanmıyorsanız veya kod tabanınız bir REST API'yi ya da kitaplığı daha iyi destekliyorsa bu seçenekleri kullanın. REST API'yi kullanarak içerik bağlayıcı oluşturmak için REST API'yi kullanarak içerik bağlayıcı oluşturma başlıklı makaleyi inceleyin.

Tipik bir içerik bağlayıcı aşağıdaki görevleri yerine getirir:

Yapılandırma parametrelerini okur ve işler.
Üçüncü taraf deposundan "öğeler" adı verilen, dizine eklenebilir verilerin ayrı parçalarını çeker.
Erişim kontrol listelerini, meta verileri ve içerik verilerini dizine eklenebilir öğeler halinde birleştirir.
Öğeleri Cloud Search veri kaynağında dizine ekler.
(İsteğe bağlı) Depodan gelen değişiklik bildirimlerini dinler. Değişiklik bildirimleri, Cloud Search veri kaynağının senkronize kalması için dizine ekleme isteklerine dönüştürülür. Bağlayıcı bu görevi yalnızca depo değişiklik algılamayı destekliyorsa gerçekleştirir.

Content Connector SDK'yı kullanarak içerik bağlayıcı oluşturma

Aşağıdaki bölümlerde, İçerik Bağlayıcı SDK'sını kullanarak nasıl içerik bağlayıcı oluşturacağınız açıklanmaktadır.

Bağımlılıkları ayarlama

Bu bağımlılıkları derleme dosyanıza ekleyin.

Maven

xml <dependency> <groupId>com.google.enterprise.cloudsearch</groupId> <artifactId>google-cloudsearch-indexing-connector-sdk</artifactId> <version>v1-0.0.3</version> </dependency>

Gradle

groovy compile group: 'com.google.enterprise.cloudsearch', name: 'google-cloudsearch-indexing-connector-sdk', version: 'v1-0.0.3'

Bağlayıcı yapılandırmanızı oluşturun

Her bağlayıcı, depo kimliğiniz gibi parametreler için bir yapılandırma dosyası kullanır. Parametreleri anahtar-değer çiftleri olarak tanımlayın. Örneğin, api.sourceId=1234567890abcdef.

Google Cloud Search SDK, tüm bağlayıcılar için Google tarafından sağlanan parametreleri içerir. Yapılandırma dosyanızda aşağıdakileri belirtmeniz gerekir:

İçerik bağlayıcı: api.sourceId ve api.serviceAccountPrivateKeyFile öğelerini beyan edin. Bunlar, deponuzu ve erişim için gereken özel anahtarı tanımlar.

Kimlik bağlayıcı: Harici kimlik kaynağınızı tanımlamak için api.identitySourceId öğesini bildirin. Kullanıcı senkronizasyonu için api.customerId (Google Workspace hesabınızın benzersiz kimliği) değerini de beyan edin.

Diğer Google tarafından sağlanan parametreleri yalnızca varsayılan değerlerini geçersiz kılmak için bildirin. Kimlik ve anahtar oluşturma hakkında ayrıntılı bilgi için Google tarafından sağlanan parametreler başlıklı makaleyi inceleyin.

Yapılandırma dosyanızda depoya özgü parametreler de tanımlayabilirsiniz.

Yapılandırma dosyasını bağlayıcıya iletme

Yapılandırma dosyasını iletmek için config sistem özelliğini ayarlayın. Bağlayıcıyı başlatırken -D argümanını kullanın. Örneğin:

java -classpath myconnector.jar -Dconfig=MyConfig.properties MyConnector

Bu bağımsız değişkeni atlarsanız SDK, yerel dizinde connector-config.properties adlı bir dosyayı kullanmaya çalışır.

Geçiş stratejinizi belirleme

İçerik bağlayıcının temel işlevi, bir depoyu geçerek verilerini dizine eklemektir. Deponuzun boyutuna ve düzenine göre bir strateji uygulamanız gerekir. Kendi stratejinizi tasarlayabilir veya SDK'dan bir strateji seçebilirsiniz:

Tam geçiş stratejisi: Deponun tamamını tarar ve her öğeyi indeksler. Bu strateji, her indeksleme sırasında tam geçişin ek yükünü karşılayabileceğiniz küçük depolar için en iyisidir. Çoğunlukla statik, hiyerarşik olmayan verilerin bulunduğu küçük depolarda veya değişiklik algılamanın zor olduğu durumlarda kullanın.
Liste geçişi stratejisi: Her öğenin durumunu belirlemek için tüm depoyu tarar, ardından yalnızca yeni veya güncellenmiş öğeleri indeksler. Değişiklik algılama desteklenmediğinde büyük ve hiyerarşik olmayan bir dizinde artımlı güncellemeler için bu yöntemi kullanın.
Grafik geçişi: Öğelerinin durumunu belirlemek için bir üst düğümü tarar, ardından bu düğümdeki yeni veya güncellenmiş öğeleri indeksler. Ardından, alt düğümleri yinelemeli olarak işler. Tüm kimliklerin listelenmesinin pratik olmadığı hiyerarşik depolar için (ör. dizin yapıları veya web siteleri) bunu kullanın.

SDK, bu stratejileri şablon bağlayıcı sınıflarında uygular. Bu şablonlar, geliştirme sürecinizi hızlandırabilir. Şablon kullanmak için ilgili bölüme bakın:

Şablon sınıfı kullanarak tam geçiş bağlayıcısı oluşturma
Şablon sınıfı kullanarak liste geçişi bağlayıcısı oluşturma
Şablon sınıfı kullanarak grafik geçişi bağlayıcısı oluşturma

Şablon sınıfı kullanarak tam geçiş bağlayıcısı oluşturma

Bu bölümde, FullTraversalSample'daki koddan bahsedilmektedir.

Bağlayıcı giriş noktasını uygulama

Giriş noktası main() yöntemidir. Application örneği oluşturur ve bağlayıcıyı çalıştırmak için start() işlevini çağırır.

application.start() işlevini çağırmadan önce IndexingApplication.Builder sınıfını kullanarak FullTraversalConnector şablonunu oluşturun. Bu şablon, Repository nesnesini kabul eder.

FullTraversalSample.java

İçerik bağlayıcı oluşturma Koleksiyonlar ile düzeninizi koruyun İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.

Content Connector SDK'yı kullanarak içerik bağlayıcı oluşturma

Bağımlılıkları ayarlama

Maven

Gradle

Bağlayıcı yapılandırmanızı oluşturun

Yapılandırma dosyasını bağlayıcıya iletme

Geçiş stratejinizi belirleme

Şablon sınıfı kullanarak tam geçiş bağlayıcısı oluşturma

Bağlayıcı giriş noktasını uygulama

Depo arayüzünü uygulama

Özel yapılandırma parametrelerini alma

Tam geçiş gerçekleştirme

Bir öğenin izinlerini ayarlama

Öğe için meta verileri ayarlama

Dizinlenebilir öğeyi oluşturma

Dizinlenebilir her öğeyi bir yineleyicide paketleyin.

Sonraki adımlar

Şablon sınıfı kullanarak liste geçişi bağlayıcısı oluşturma

Bağlayıcı giriş noktasını uygulama

Depo arayüzünü uygulama

Liste geçişini gerçekleştirme

Öğe kimliklerini ve karma değerlerini gönderme

Her öğeyi alıp işleme

Silinen öğeleri yönetme

Değiştirilmeyen öğeleri işleme

Bir öğenin izinlerini ayarlama

Öğe için meta verileri ayarlama

Dizinlenebilir öğe oluşturma

Sonraki adımlar

Şablon sınıfı kullanarak grafik geçişi bağlayıcısı oluşturma

Bağlayıcının giriş noktasını uygulama

Depo arayüzünü uygulama

Grafik geçişini gerçekleştirme

Öğe kimliklerini ve karma değerlerini gönderme

Her öğeyi alıp işleme

Silinen öğeleri yönetme

Meta verileri ayarlama ve öğeyi oluşturma

Alt öğe kimliklerini dizine ekleme sırasına yerleştirme

REST API'yi kullanarak içerik bağlayıcısı oluşturma

Geçiş stratejinizi belirleme

Geçiş stratejinizi uygulama ve öğeleri dizine ekleme

Depo değişikliklerini işleme

İçerik bağlayıcı oluşturma