CSV Bağlayıcısı dağıtma

Bu kılavuz, Google Cloud Search CSV (virgülle ayrılmış değerler) bağlayıcı yöneticileri, yani bağlayıcıyı indirmek, yapılandırmak, çalıştırmak ve izlemekten sorumlu herkes için hazırlanmıştır.

Bu kılavuz, CSV bağlayıcı dağıtımıyla ilgili temel görevlerin gerçekleştirilmesine yönelik talimatları içerir:

  • Google Cloud Search CSV bağlayıcı yazılımını indirin
  • Bağlayıcıyı belirli bir CSV veri kaynağıyla kullanmak üzere yapılandırma
  • Bağlayıcıyı dağıtma ve çalıştırma

Bu belgedeki kavramları anlamak için Google Workspace, CSV dosyaları ve Erişim Kontrol Listeleri (EKL'ler) ile ilgili temel bilgilere sahip olmanız gerekir.

Google Cloud Search CSV bağlayıcısına genel bakış

Cloud Search CSV bağlayıcısı, virgülle ayrılmış değerler (CSV) metin dosyalarıyla çalışır. CSV dosyası, tablo biçiminde veriler depolar ve dosyanın her satırı bir veri kaydıdır.

Google Cloud Search'ün CSV Bağlayıcısı, bir CSV dosyasından ayrı ayrı satırları çıkarır ve Cloud Search'ün Dizine Ekleme API'si aracılığıyla Cloud Search'te dizine ekler. Başarılı bir şekilde dizine eklendikten sonra, CSV dosyalarındaki her bir satır, Cloud Search istemcileri veya Cloud Search'ün Query API'si aracılığıyla aranabilir. CSV bağlayıcısı, EKL'leri kullanarak kullanıcıların arama sonuçlarındaki içeriğe erişiminin denetlenmesini de destekler.

Google Cloud Search CSV bağlayıcısı, Linux veya Windows'a yüklenebilir. Google Cloud Search CSV bağlayıcısını dağıtmadan önce aşağıdaki gerekli bileşenlere sahip olduğunuzdan emin olun:

  • Google Cloud Search CSV bağlayıcısını çalıştıran bir bilgisayarda Java JRE 1.8 yüklü
  • Google Cloud Search ile veri kaynağı arasında ilişki kurmak için gereken Google Workspace bilgileri:

    Genellikle bu kimlik bilgilerini alanın Google Workspace yöneticisi size sağlayabilir.

Dağıtım adımları

Google Cloud Search CSV bağlayıcısını dağıtmak için aşağıdaki adımları uygulayın:

  1. Google Cloud Search CSV bağlayıcı yazılımını yükleme
  2. CSV bağlayıcısı yapılandırmasını belirtme
  3. Google Cloud Search veri kaynağına erişimi yapılandırma
  4. CSV dosyası erişimini yapılandırma
  5. Dizine eklenecek sütun adlarını, benzersiz anahtar sütunlarını ve tarih ve saat sütunlarını belirtin
  6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme
  7. Meta veri bilgilerini, sütun biçimlerini belirtme
  8. Veri geçişini programlama
  9. Erişim Kontrol Listesi (ACL) seçeneklerini belirtme

1. SDK'yı yükleyin

SDK'yı yerel Maven deponuza yükleyin.

  1. GitHub'dan SDK deposunu klonlayın.

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv
  2. İstediğiniz SDK sürümünü kontrol edin:

    $ git checkout tags/v1-0.0.3
  3. Bağlayıcıyı oluşturun:

    $ mvn package
  4. Bağlayıcı ZIP dosyasını yerel yükleme dizininize kopyalayın:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. CSV bağlayıcı yapılandırmasını belirtme

Bağlayıcı yöneticisi olarak, CSV bağlayıcısının davranışını ve bağlayıcının yapılandırma dosyasındaki parametreleri tanımlayan özellikleri kontrol edersiniz. Yapılandırılabilir parametreler şunlardır:

  • Bir veri kaynağına erişim
  • CSV dosyasının konumu
  • CSV sütun tanımları
  • Benzersiz bir kimliği tanımlayan sütunlar
  • Geçiş seçenekleri
  • Veri erişimini kısıtlamak için kullanılan EKL seçenekleri

Bağlayıcının bir CSV dosyasına düzgün şekilde erişmesi ve ilgili içeriği dizine eklemesi için öncelikle yapılandırma dosyasını oluşturmanız gerekir.

Bir yapılandırma dosyası oluşturmak için:

  1. İstediğiniz bir metin düzenleyiciyi açın ve yapılandırma dosyasına bir ad verin.
    Dosya içeriğine aşağıdaki bölümlerde açıklanan şekilde anahtar=değer çiftleri ekleyin.
  2. Yapılandırma dosyasını kaydedin ve adlandırın.
    Google, yapılandırma dosyasını connector-config.properties olarak adlandırmanızı önerir. Böylece, bağlayıcıyı çalıştırmak için ek komut satırı parametrelerine gerek kalmaz.

Yapılandırma dosyası yolunu komut satırında belirtebileceğiniz için standart bir dosya konumu gerekli değildir. Ancak, bağlayıcının izlenmesini ve çalıştırılmasını kolaylaştırmak için yapılandırma dosyasını bağlayıcıyla aynı dizinde tutun.

Bağlayıcının yapılandırma dosyanızı tanıdığından emin olmak için komut satırında dosyanın yolunu belirtin. Aksi takdirde, bağlayıcı, yerel dizininizdeki varsayılan dosya adı olarak connector-config.properties'i kullanır. Komut satırında yapılandırma yolunu belirtme hakkında bilgi edinmek için Cloud Search CSV bağlayıcısını çalıştırma bölümüne bakın.

3. Google Cloud Search veri kaynağına erişimi yapılandırma

Her yapılandırma dosyasının belirtmesi gereken ilk parametreler, aşağıdaki tabloda gösterildiği gibi, Cloud Search veri kaynağına erişmek için gerekli olan parametrelerdir. Genellikle bağlayıcının Cloud Search'e erişimini yapılandırmak için veri kaynağı kimliği, hizmet hesabı kimliği ve hizmet hesabı özel anahtar dosyasının yoluna ihtiyacınız vardır. Veri kaynağı oluşturmak için gereken adımlar Üçüncü taraf veri kaynaklarını yönetme bölümünde açıklanmıştır.

Ayar Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği (Üçüncü taraf veri kaynaklarını yönetme başlıklı makalede açıklandığı şekilde).

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search CSV bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Harici kullanıcılar ve gruplar kullanılıyorsa gereklidir. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kimlik kaynağı kimliği.

4. CSV dosyası parametrelerini yapılandırma

Bağlayıcının bir CSV dosyasını gezinip dizine eklemek üzere dosyadan veri çıkarabilmesi için dosyanın yolunu belirlemeniz gerekir. Ayrıca, dosya biçimini ve dosya kodlama türünü de belirtebilirsiniz. Yapılandırma dosyasında CSV dosyası özelliklerini belirtmek için aşağıdaki parametreleri ekleyin.

Ayar Parametre
CSV dosyasının yolu csv.filePath=./movie_content.csv

Zorunlu. Erişilecek ve dizine eklenecek içerik çıkarılacak CSV dosyasının yolu.

Dosya biçimi csv.format=DEFAULT

Dosyanın biçimi. Olası değerler, Apache Commons CSV CSVFormat sınıfından alınmıştır.

Biçim değerleri şunlardır: DEFAULT, EXCEL, INFORMIX_UNLOAD, INFORMIX_UNLOAD_CSV, MYSQL, RFC4180, ORACLE, POSTGRESQL_CSV, POSTGRESQL_TEXT ve TDF. Belirtilmemişse Cloud Search, DEFAULT değerini kullanır.

Dosya biçimi değiştirici csv.format.withMethod=value

Cloud Search'ün dosyayı işleme biçiminde yapılan bir değişiklik. Olası yöntemler Apache Commons CSV CSVFormat sınıfına aittir ve tek bir karakter, dize veya boole değeri alan yöntemlerdir.

Örneğin, noktalı virgülü ayırıcı olarak belirtmek için csv.format.withDelimiter=; işlevini kullanın. Boş satırları yoksaymak için csv.format.withIgnoreEmptyLines=true işlevini kullanın.

Dosya kodlama türü csv.fileEncoding=UTF-8

Cloud Search dosyayı okuduğunda kullanılacak Java karakter kümesi. Belirtilmemişse Cloud Search, platformun varsayılan karakter kümesini kullanır.

5. Dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirtin

Bağlayıcının CSV dosyalarına erişmesi ve dizine eklemesi için yapılandırma dosyasında sütun tanımları hakkında bilgi sağlamanız gerekir. Yapılandırma dosyası, dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirten parametreleri içermiyorsa varsayılan değerler kullanılır.

Ayar Parametre
Dizine eklenecek sütunlar csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...

CSV dosyasından dizine eklenecek sütun adları. csv.csvColumns ayarlanmazsa CSV dosyasının ilk satırı başlık olarak kullanılır. csv.csvColumns ayarlanırsa CSV'nin ilk satırına göre öncelikli olur. csv.csvColumns ayarladıysanız ve CSV dosyasının ilk satırı sütun adları listesiyse, ilk satırı veri olarak dizine eklemeye çalışmamak için csv.skipHeaderRecord=true değerini ayarlamanız gerekir. Varsayılan değerler, dosyanın başlık satırındaki sütunlardır.

Benzersiz anahtar sütunları csv.uniqueKeyColumns=movieId

Her bir kaydın benzersiz kimliğini oluşturmak için değerleri kullanılacak olan CSV sütunları. Belirtilmezse, CSV kaydının karma değeri benzersiz anahtar olarak kullanılmalıdır. Varsayılan değer, kaydın karma kodudur.

6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme

Bir kullanıcı Google Cloud Search kullanarak arama yaptığında, yanıt her bir sonuç için tıklanabilir URL'ler içeren bir sonuç sayfası gösterir. Bu özelliği etkinleştirmek için aşağıdaki tabloda gösterilen parametreyi yapılandırma dosyasına eklemeniz gerekir.

Ayar Parametre
Arama sonucu URL'si biçimi url.format=https://mymoviesite.com/movies/{0}

Zorunlu. CSV içeriği için görüntüleme URL'sinin oluşturulacağı biçim.

Arama sonuçları URL parametreleri. url.columns=movieId

Zorunlu. Kaydın görüntüleme URL'sini oluşturmak için değerleri kullanılacak olan CSV sütun adları.

Kaçış için arama sonuçları URL parametreleri url.columnsToEscape=movieId

İsteğe bağlı. Geçerli görüntüleme URL'si oluşturmak için değerleri URL çıkışlı olacak olan CSV sütun adları.

7. Meta veri bilgilerini, sütun biçimlerini ve arama kalitesini belirtin

Yapılandırma dosyasına aşağıdakileri belirten parametreler ekleyebilirsiniz:

Meta Veri Yapılandırma Parametreleri

Meta Veri Yapılandırma Parametreleri, öğe meta verilerini doldurmak için kullanılan CSV sütunlarını açıklar. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Ayar Parametre
Başlık itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind

Doküman başlığına karşılık gelen değeri içeren meta veri özelliği. Varsayılan değer boş bir dizedir.

URL itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Arama sonuçları için doküman URL'sinin değerini içeren meta veri özelliği.
Oluşturulma zaman damgası itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17

Belge oluşturma zaman damgası değerini içeren meta veri özelliği.

Son değiştirilme zamanı itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17

Dokümanın son değişiklik zaman damgasının değerini içeren meta veri özelliği.

Doküman dili itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US

Dizine eklenen dokümanların içerik dili.

Şema nesnesi türü itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie

Şemada tanımlandığı şekilde, bağlayıcı tarafından kullanılan nesne türü. Bu özellik belirtilmezse bağlayıcı, yapılandırılmış verileri dizine eklemez.

Tarih ve saat biçimleri

Tarih ve saat biçimleri, meta veri özelliklerinde beklenen biçimleri belirtir. Yapılandırma dosyası bu parametreyi içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametre gösterilmektedir.

Ayar Parametre
Ek tarih ve saat biçimleri structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Ek java.time.format.DateTimeFormatter kalıplarının noktalı virgülle ayrılmış listesi. Kalıplar, meta veri veya şemadaki herhangi bir tarih veya tarih-saat alanlarının dize değerleri ayrıştırılırken kullanılır. Varsayılan değer boş bir listedir ancak RFC 3339 ve RFC 1123 biçimleri her zaman desteklenir.

Sütun biçimleri

Sütun biçimleri, aranabilir içeriğin bir parçası olması gereken sütunlarla ilgili bilgileri belirtir. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Ayar Parametre
Üstbilgiyi atla csv.skipHeaderRecord=true

Boole. CSV dosyasındaki başlık kaydını (ilk satır) yok sayın. csv.csvColumns ayarladıysanız ve CSV dosyasında başlık satırı varsa skipHeaderRecord=true değerini ayarlamanız gerekir. Bu, dosyadaki ilk satırın veri olarak dizine eklenmesini engeller. CSV dosyasında başlık satırı yoksa skipHeaderRecord=false değerini ayarlayın. Varsayılan değer, false (yanlış) değeridir.

Birden çok değerli sütunlar csv.multiValueColumns=genre,actors

CSV dosyasında birden çok değere sahip sütun adları. Varsayılan değer boş bir dizedir.

Birden çok değerli sütunlar için sınırlayıcı csv.multiValue.genre=;

Birden çok değerli sütunlar için sınırlayıcıdır. Varsayılan ayırıcı virgüldür.

Arama kalitesi

Cloud Search CSV bağlayıcısı, veri alanları için otomatik HTML biçimlendirmesine olanak tanır. Bağlayıcınız, veri alanlarını bağlayıcı yürütmenin başında tanımlar ve daha sonra, her bir veri kaydını Cloud Search'e yüklemeden önce biçimlendirmek için bir içerik şablonu kullanır.

İçerik şablonu, arama için her alan değerinin önemini tanımlar. Başlık alanı zorunludur ve en yüksek öncelik olarak tanımlanır. Diğer tüm içerik alanları için arama kalitesi önem düzeylerini yüksek, orta veya düşük olarak belirtebilirsiniz. Belirli bir kategoride tanımlanmamış tüm içerik alanları varsayılan olarak düşük öncelikli olur. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Ayar Parametre
İçerik başlığı contentTemplate.csv.title=movieTitle

İçerik başlığı, en yüksek arama kalitesi alanıdır.

İçerik alanları için arama kalitesinin yüksek olması contentTemplate.csv.quality.high=actors

Arama kalitesi için yüksek değer verilen içerik alanları. Varsayılan değer boş bir dizedir.

İçerik alanları için arama kalitesinin düşük olması contentTemplate.csv.quality.low=genre

İçerik alanlarına düşük arama kalitesi değeri verildi. Varsayılan değer boş bir dizedir.

İçerik alanları için orta seviye arama kalitesi contentTemplate.csv.quality.medium=description

İçerik alanlarına orta düzeyde bir arama kalitesi değeri verilir. Varsayılan değer boş bir dizedir.

Belirtilmemiş içerik alanları contentTemplate.csv.unmappedColumnsMode=IGNORE

Bağlayıcının belirtilmemiş içerik alanlarını işleme şekli. Valid values are:

  • APPEND: Belirtilmemiş içerik alanlarını şablona ekleyin
  • IGNORE - Belirtilmemiş içerik alanlarını yoksayın

    Varsayılan değer APPEND. değeridir.

8. Veri geçişini planlama

Geçiş, bağlayıcının veri kaynağından içerik (bu örnekte bir CSV dosyası) bulmaya yönelik işlemidir. CSV bağlayıcısı çalışırken, bir CSV dosyasının satırlarını aktarır ve Dizine Ekleme API'si aracılığıyla her satırı Cloud Search'e dizine ekler.

Tam geçiş, dosyadaki tüm sütunları dizine ekler. Artımlı geçiş yalnızca önceki geçişten sonra eklenen veya değiştirilen sütunları dizine ekler. CSV bağlayıcısı yalnızca tam geçiş işlemleri gerçekleştirir. Artımlı geçişler gerçekleştirmez.

Planlama parametreleri, bağlayıcının geçişler arasında ne sıklıkta bekleyeceğini belirler. Yapılandırma dosyası planlama parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Ayar Parametre
Bir aralıktan sonra tam geçiş schedule.traversalIntervalSecs=7200

Bağlayıcı, belirtilen bir aralıktan sonra tam geçiş gerçekleştirir. Geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 86400'dür (bir gündeki saniye sayısı).

Bağlayıcı başlatıldığında tam geçiş schedule.performTraversalOnStart=false

Bağlayıcı, ilk aralığın süresinin dolmasını beklemek yerine, bağlayıcı başlatılırken tam bir geçiş gerçekleştirir. Varsayılan değer true (doğru) değeridir.

9. Erişim Kontrol Listesi (ACL) seçeneklerini belirtin

Google Cloud Search CSV bağlayıcısı, arama sonuçlarındaki CSV dosyasının içeriğine erişimi kontrol etmek için EKL'ler aracılığıyla izinleri destekler. Dizine eklenen kayıtlara kullanıcı erişimini korumanızı sağlayacak birçok EKL seçeneği vardır.

Deponuz her belgeyle ilişkili ayrı EKL bilgilerine sahipse Cloud Search'teki belge erişimini kontrol etmek için tüm EKL bilgilerini yükleyin. Deponuz kısmi EKL bilgisi sağlıyor veya hiç EKL bilgisi sağlamıyorsa SDK'nın bağlayıcıya sağladığı aşağıdaki parametrelerle varsayılan EKL bilgilerini sağlayabilirsiniz.

Bağlayıcı için yapılandırma dosyasında varsayılan EKL'lerin etkinleştirilmesi gerekir. Varsayılan EKL'leri etkinleştirmek için defaultAcl.mode öğesini none dışında bir moda ayarlayın ve defaultAcl.* ile yapılandırın

Ayar Parametre
EKL modu defaultAcl.mode=fallback

Zorunlu. CSV bağlayıcısı, Varsayılan EKL işlevini kullanır. Bağlayıcı yalnızca yedek modu destekler.

Varsayılan EKL Adı defaultAcl.name=VIRTUAL_CONTAINER_FOR_CONNECTOR_1

İsteğe bağlı. Varsayılan EKL'leri ayarlamak için bağlayıcı tarafından kullanılan sanal kapsayıcı adının geçersiz kılınmasına olanak tanır. Varsayılan değer "DEFAULT_ACL_VIRTUAL_CONTAINER" şeklindedir. Birden çok bağlayıcı aynı veri kaynağındaki içeriği dizine ekliyorsa bu değeri geçersiz kılmak isteyebilirsiniz.

Varsayılan genel EKL defaultAcl.public=true

Deponun tamamı için kullanılan varsayılan EKL, genel alan erişimi olarak ayarlanmıştır. Varsayılan değer false.

Ortak EKL grubu okuyucuları defaultAcl.readers.groups=google:group1, group2
Yaygın EKL okuyucuları defaultAcl.readers.users=user1, user2, google:user3
Yaygın EKL tarafından reddedilen grup okuyucuları defaultAcl.denied.groups=group3
EKL tarafından reddedilen okuyucular defaultAcl.denied.users=user4, user5
Tam alan erişimi Dizine eklenen her kaydın alan adındaki tüm kullanıcılar tarafından erişilebilir olmasını sağlamak için aşağıdaki seçeneklerin ikisini de değerlerle ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=true
Ortak tanımlı EKL Veri havuzunun her bir kaydı için bir EKL belirtmek üzere aşağıdaki parametre değerlerinin tümünü ayarlayın:
  • defaultAcl.mode=fallback
  • defaultAcl.public=false
  • defaultAcl.readers.groups=google:group1, group2
  • defaultAcl.readers.users=user1, user2, google:user3
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Önünde "google:" (değişmez sabit) olmadığı sürece, belirtilen her kullanıcı ve grubun yerel alanda tanımlı bir kullanıcı/grup olduğu varsayılır.

    Varsayılan kullanıcı veya grup boş bir dizedir. Kullanıcı ve grup seçeneklerini yalnızca defaultAcl.public, false olarak ayarlanmışsa sağlayın. Birden çok grup ve kullanıcıyı listelemek için virgülle ayrılmış liste kullanın.

    defaultAcl.mode, none olarak ayarlanırsa tanımlı bağımsız EKL'ler olmadan kayıtlar aranamaz.

Şema Tanımı

Cloud Search, yapılandırılmış ve yapılandırılmamış içeriklerin dizine eklenmesine ve sunulmasına olanak tanır. Verilerinizde yapılandırılmış veri sorgularını desteklemek üzere veri kaynağınız için Şemayı ayarlamanız gerekir.

Tanımlandıktan sonra CSV Bağlayıcısı, dizine ekleme istekleri oluşturmak için tanımlanan şemaya başvurabilir. Açıklayıcı bir örnek vermek gerekirse, Filmler hakkında bilgiler içeren bir CSV dosyasını ele alalım.

Giriş CSV dosyasında aşağıdaki içeriklerin bulunduğunu varsayalım.

  1. movieId
  2. movieTitle
  3. açıklama
  4. yıl
  5. releaseDate
  6. aktörler (virgül (,) ile ayrılmış birden çok değer)
  7. tür (birden fazla değer)
  8. değerlendirmeler

Yukarıdaki veri yapısına bağlı olarak, CSV dosyasındaki verileri dizine eklemek istediğiniz bir veri kaynağı için şema tanımlayabilirsiniz.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Örnek yapılandırma dosyası

Aşağıdaki örnek yapılandırma dosyasında, örnek bir bağlayıcının davranışını tanımlayan key=value parametresi çiftleri gösterilmektedir.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Her bir parametrenin ayrıntılı açıklamaları için Yapılandırma parametreleri referansına bakın.

Cloud Search CSV bağlayıcısını çalıştırma

Bağlayıcıyı komut satırından çalıştırmak için aşağıdaki komutu yazın:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Varsayılan olarak, bağlayıcı günlükleri standart çıkışta sunulur. logging.properties belirterek dosyalara giriş yapabilirsiniz.