CSV Bağlayıcı dağıtma

Bu kılavuz, Google Cloud Search CSV (virgülle ayrılmış değerler) bağlayıcı yöneticilerine, yani bağlayıcıyı indirmekten, yapılandırmaktan, çalıştırmaktan ve izlemekten sorumlu olan herkes için hazırlanmıştır.

Bu kılavuzda, CSV bağlayıcı dağıtımıyla ilgili temel görevlerin yerine getirilmesine ilişkin talimatlar yer almaktadır:

  • Google Cloud Search CSV bağlayıcı yazılımını indirin
  • Bağlayıcıyı belirli bir CSV veri kaynağıyla kullanmak için yapılandırın
  • Bağlayıcıyı dağıtma ve çalıştırma

Bu belgedeki kavramları anlamak için Google Workspace, CSV dosyaları ve Erişim Kontrol Listeleri (EKL'ler) ile ilgili temel bilgileri edinmelisiniz.

Google Cloud Search CSV bağlayıcısına genel bakış

Cloud Search CSV bağlayıcısı, virgülle ayrılmış değerler (CSV) metin dosyasıyla da çalışır. Bir CSV dosyası, tablo halindeki verileri depolar ve dosyanın her bir satırı bir veri kaydıdır.

Google Cloud Search'ün CSV Bağlayıcısı, CSV dosyasındaki satırları bağımsız olarak ayıklar ve Cloud Search'ün Dizine Ekleme API'si aracılığıyla bunları dizine ekler. Başarıyla dizine eklendikten sonra, CSV dosyalarındaki ayrı satırlar Cloud Search'ün istemcileri veya Cloud Search'ün Query API'si ile aranabilir. CSV bağlayıcısı, kullanıcıların EKL'ler kullanarak arama sonuçlarındaki içeriğe erişimini denetlemeyi de destekler.

Google Cloud Search CSV bağlayıcısı Linux veya Windows'a yüklenebilir. Google Cloud Search CSV bağlayıcısını dağıtmadan önce aşağıdaki gerekli bileşenlere sahip olduğunuzdan emin olun:

  • Google Cloud Search CSV bağlayıcısını çalıştıran bir bilgisayara Java JRE 1.8 yüklenmiş olmalıdır
  • Google Cloud Search ile veri kaynağı arasında ilişki kurmak için gereken Google Workspace bilgileri:

    Genellikle alanın Google Workspace yöneticisi bu kimlik bilgilerini sizin için sağlayabilir.

Dağıtım adımları

Google Cloud Search CSV bağlayıcısını dağıtmak için aşağıdaki adımları uygulayın:

  1. Google Cloud Search CSV bağlayıcı yazılımını yükleyin
  2. CSV bağlayıcı yapılandırmasını belirtme
  3. Google Cloud Search veri kaynağına erişimi yapılandırma
  4. CSV dosyası erişimini yapılandırma
  5. Dizine eklenecek sütun adlarını, benzersiz anahtar sütunları ve tarih ve saat sütunlarını belirtme
  6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtme
  7. Meta veri bilgilerini, sütun biçimlerini belirtme
  8. Veri geçişini planlama
  9. Erişim Kontrol Listesi (EKL) seçeneklerini belirtme

1. SDK'yı yükleyin

SDK'yı yerel Maven deponuza yükleyin.

  1. GitHub'dan SDK deposunu klonlayın.

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv
  2. İstediğiniz SDK sürümüne göz atın:

    $ git checkout tags/v1-0.0.3
  3. Bağlayıcıyı oluşturun:

    $ mvn package
  4. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. CSV bağlayıcı yapılandırmasını belirtme

Bağlayıcı yöneticisi olarak, CSV bağlayıcısının davranışını ve bağlayıcının yapılandırma dosyasındaki parametreleri tanımlayan özellikleri kontrol edersiniz. Yapılandırılabilir parametreler şunlardır:

  • Veri kaynağına erişim
  • CSV dosyasının konumu
  • CSV sütun tanımları
  • Benzersiz bir kimliği tanımlayan sütunlar
  • Geçiş seçenekleri
  • Veri erişimini kısıtlamak için EKL seçenekleri

Bağlayıcının bir CSV dosyasına doğru şekilde erişmesi ve ilgili içeriği dizine eklemesi için önce dosyanın yapılandırma dosyasını oluşturmanız gerekir.

Yapılandırma dosyası oluşturmak için:

  1. İstediğiniz bir metin düzenleyicisini açın ve yapılandırma dosyasını adlandırın.
    Dosya bölümlerine aşağıdaki bölümlerde açıklandığı gibi key=value çifti ekleyin.
  2. Yapılandırma dosyasını kaydedin ve adlandırın.
    Google, yapılandırma dosyasını adlandırmanızı önerir connector-config.properties bağlayıcı çalıştırmak için ek komut satırı parametrelerine gerek yoktur.

Yapılandırma dosyası yolunu komut satırında belirtebileceğiniz için standart dosya konumu gerekli değildir. Ancak bağlayıcıyı izlemeyi ve çalıştırmayı kolaylaştırmak için yapılandırma dosyasını, bağlayıcıyla aynı dizinde tutun.

Bağlayıcının yapılandırma dosyanızı tanımasını sağlamak için komut satırında yolunu belirtin. Aksi takdirde, bağlayıcı yerel dizininizdeki varsayılan dosya adı olarak connector-config.properties özelliğini kullanır. Komut satırında yapılandırma yolunu belirtme hakkında bilgi edinmek için Cloud Search CSV bağlayıcısını çalıştırma başlıklı makaleye göz atın.

3. Google Cloud Search veri kaynağına erişimi yapılandırın

Her yapılandırma dosyasının belirtmesi gereken ilk parametreler, aşağıdaki tabloda gösterildiği gibi Cloud Search veri kaynağına erişmek için gereken parametrelerdir. Bağlayıcının Cloud Search'e erişimini yapılandırmak için genellikle veri kaynağı kimliği, hizmet hesabı kimliği ve hizmet hesabının özel anahtar dosyasının yolu gerekir. Veri kaynağı oluşturmak için gereken adımlar, Üçüncü taraf veri kaynaklarını yönetme başlıklı makalede açıklanmıştır.

Tema Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Üçüncü taraf veri kaynaklarını yönetme başlıklı makalede açıklandığı şekilde, Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search CSV bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Harici kullanıcılar ve gruplar kullanılıyorsa gereklidir. Google Workspace yöneticisi tarafından oluşturulan Cloud Search kimlik kaynağı kimliği.

4. CSV dosyası parametrelerini yapılandırma

Bağlayıcının bir CSV dosyasından bilgi çekip aktarabilmesi ve bu dizine ait verileri ayıklayabilmesi için dosyanın yolunu belirlemeniz gerekir. Dosya biçimini ve dosya kodlaması türünü de belirtebilirsiniz. Yapılandırma dosyasında CSV dosyasının özelliklerini belirtmek için aşağıdaki parametreleri ekleyin.

Tema Parametre
CSV dosyasının yolu csv.filePath=./movie_content.csv

Zorunlu. Erişilecek ve dizine eklenecek içerik ayıklanacak CSV dosyasının yolu.

Dosya biçimi csv.format=DEFAULT

Dosyanın biçimi. Olası değerler, Apache Commons CSV CSVFormat sınıfından alınır.

Biçim değerleri şunları içerir: DEFAULT, EXCEL, INFORMIX_UNLOAD, INFORMIX_UNLOAD_CSV, MYSQL, RFC4180, ORACLE, POSTGRESQL_CSV, POSTGRESQL_TEXT ve TDF Belirtilmezse Cloud Search, DEFAULT kullanır.

Dosya biçimi değiştiricisi csv.format.withMethod=value

Cloud Search'ün dosyayı işleme biçiminde bir değişiklik yapıldı. Olası yöntemler, Apache Commons CSV CSVFormat sınıfındandır ve tek bir karakter, dize veya Boole değeri alan yöntemleri içerir.

Örneğin, ayırıcı olarak noktalı virgül belirtmek için csv.format.withDelimiter=; kullanın. Boş satırları yoksaymak için csv.format.withIgnoreEmptyLines=true işaretini kullanın.

Dosya kodlama türü csv.fileEncoding=UTF-8

Cloud Search dosyayı okuduğunda kullanılacak Java karakteri. Belirtilmezse Cloud Search, platformdaki varsayılan karakter kümesini kullanır.

5. Dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirtin

Bağlayıcının CSV dosyalarına erişmesi ve bunları dizine eklemesi için yapılandırma dosyasındaki sütun tanımları hakkında bilgi vermeniz gerekir. Yapılandırma dosyası, dizine eklenecek sütun adlarını ve benzersiz anahtar sütunlarını belirten parametreleri içermiyorsa varsayılan değerler kullanılır.

Tema Parametre
Dizine eklenecek sütunlar csv.csvColumns=movieId,movieTitle,description,actors,releaseDate,year,userratings...

CSV dosyasından dizine eklenecek sütun adları. csv.csvColumns ayarlanmazsa CSV dosyasının ilk satırı başlık olarak kullanılır. csv.csvColumns ayarlanırsa CSV'nin ilk satırından daha öncelikli olur. csv.csvColumns değerini ayarladıysanız ve CSV dosyasının ilk satırı sütun adlarının bir listesiyse ilk satırı veri olarak dizine eklemeye çalışmamak için csv.skipHeaderRecord=true değerini ayarlamanız gerekir. Varsayılan değerler, dosyadaki başlık satırında yer alan sütunlardır.

Benzersiz anahtar sütunları csv.uniqueKeyColumns=movieId

Değerleri her bir kaydın benzersiz kimliğini oluşturmak için kullanılacak CSV sütunları. Belirtilmezse CSV kaydının karma değeri, benzersiz anahtarı olarak kullanılmalıdır. Varsayılan değer, kaydın karma kodudur.

6. Tıklanabilir arama sonucu URL'lerinde kullanılacak sütunları belirtin

Bir kullanıcı Google Cloud Search'ü kullanarak arama yaptığında, her bir sonuç için tıklanabilir URL'ler içeren bir sonuçlar sayfası göstererek yanıt verir. Bu özelliği etkinleştirmek için aşağıdaki tabloda gösterilen parametreyi yapılandırma dosyasına eklemeniz gerekir.

Tema Parametre
Arama sonucu URL biçimi url.format=https://mymoviesite.com/movies/{0}

Zorunlu. CSV içeriği için görünüm URL'sinin oluşturulacağı biçim.

Arama sonuçları URL parametreleri. url.columns=movieId

Zorunlu. Değerleri, kaydın görünüm URL'sini oluşturmak için kullanılacak CSV sütun adları.

Çıkış yapılacak arama sonuçları URL parametreleri url.columnsToEscape=movieId

İsteğe bağlı. Geçerli görünüm URL'si oluşturmak için değerleri URL'den çıkış yapılacak CSV sütun adları.

7. Meta veri bilgilerini, sütun biçimlerini, arama kalitesini belirtin

Yapılandırma dosyasına aşağıdakileri belirten parametreler ekleyebilirsiniz:

Meta Veri Yapılandırma Parametreleri

Meta Veri Yapılandırma Parametreleri, öğe meta verilerini doldurmak için kullanılan CSV sütunlarını açıklar. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Ayar Parametre
Unvan itemMetadata.title.field=movieTitle
itemMetadata.title.defaultValue=Gone with the Wind

Doküman başlığına karşılık gelen değeri içeren meta veri özelliği. Varsayılan değer boş bir dizedir.

URL itemMetadata.sourceRepositoryUrl.field=url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
Arama sonuçları için doküman URL'sinin değerini içeren meta veri özelliği. ,
Oluşturulan zaman damgası itemMetadata.createTime.field=releaseDate
itemMetadata.createTime.defaultValue=1940-01-17

Doküman oluşturma zaman damgası değerini içeren meta veri özelliği.

Son değiştirilme zamanı itemMetadata.updateTime.field=releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17

Dokümanın son değiştirme zaman damgasına ait değeri içeren meta veri özelliği.

Doküman dili itemMetadata.contentLanguage.field=languageCode
itemMetadata.contentLanguage.defaultValue=en-US

Dizine eklenen dokümanların içerik dili.

Şema nesnesi türü itemMetadata.objectType.field=type
itemMetadata.objectType.defaultValue=movie

Şemada tanımlandığı gibi bağlayıcı tarafından kullanılan nesne türü. Bu özellik belirtilmezse bağlayıcı herhangi bir yapılandırılmış veriyi dizine eklemez.

Tarih ve saat biçimleri

Tarih ve saat biçimleri, meta veri özelliklerinde beklenen biçimleri belirtir. Yapılandırma dosyası bu parametreyi içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametre gösterilmektedir.

Ayar Parametre
Ek tarih ve saat biçimleri structuredData.dateTimePatterns=MM/dd/uuuu HH:mm:ssXXX
Ek java.time.format.DateTimeFormatter kalıplarının noktalı virgül ile ayrılmış listesi. Kalıplar, meta verilerdeki veya şemadaki herhangi bir tarih veya tarih/saat alanının dize değerleri ayrıştırılırken kullanılır. Varsayılan değer boş bir liste olsa da RFC 3339 ve RFC 1123 biçimleri her zaman desteklenmektedir.

Sütun biçimleri

Sütun biçimleri, aranabilir içeriğin bir parçası olması gereken sütunlarla ilgili bilgileri belirtir. Yapılandırma dosyası bu parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Tema Parametre
Atlama başlığı csv.skipHeaderRecord=true

Boole. CSV dosyasındaki başlık kaydını (ilk satır) yok sayın. csv.csvColumns ayarladıysanız ve CSV dosyasında bir başlık satırı varsa skipHeaderRecord=true değerini ayarlamanız gerekir. Bu, dosyanın ilk satırının veri olarak dizine eklenmesini engeller. CSV dosyasında başlık satırı yoksa skipHeaderRecord=false değerini ayarlayın. Varsayılan değer, false değeridir.

Birden çok değerli sütunlar csv.multiValueColumns=genre,actors

CSV dosyasındaki birden çok değer içeren sütun adları. Varsayılan değer boş bir dizedir.

Birden çok değerli sütunlar için sınırlayıcı csv.multiValue.genre=;

Birden çok değerli sütunların sınırlayıcısı. Varsayılan sınırlayıcı virgüldür.

Arama kalitesi

Cloud Search CSV bağlayıcısı, veri alanları için otomatik HTML biçimlendirmesine olanak tanır. Bağlayıcınız, bağlayıcı yürütmenin başında veri alanlarını tanımlar ve ardından her veri kaydını Cloud Search'e yüklemeden önce biçimlendirmek için bir içerik şablonu kullanır.

İçerik şablonu, arama için her alan değerinin önemini tanımlar. Başlık alanı gereklidir ve en yüksek öncelik olarak tanımlanır. Diğer tüm içerik alanları için arama kalitesi önem düzeylerini tanımlayabilirsiniz: yüksek, orta veya düşük. Belirli bir kategoride tanımlanmayan tüm içerik alanları, varsayılan olarak düşük önceliğe sahiptir. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Tema Parametre
İçerik başlığı contentTemplate.csv.title=movieTitle

İçerik başlığı en yüksek arama kalitesi alanıdır.

İçerik alanları için yüksek arama kalitesi contentTemplate.csv.quality.high=actors

Arama kalitesi değeri yüksek içerik alanları. Varsayılan değer boş dizedir.

İçerik alanları için düşük arama kalitesi contentTemplate.csv.quality.low=genre

Arama kalitesi değeri düşük içerik alanları. Varsayılan değer boş dizedir.

İçerik alanları için orta düzeyde arama kalitesi contentTemplate.csv.quality.medium=description

Orta düzeyde bir arama kalitesi değeri verilen içerik alanları. Varsayılan değer boş dizedir.

Belirtilmemiş içerik alanları contentTemplate.csv.unmappedColumnMode=IGNORE

Bağlayıcının belirtilmemiş içerik alanlarını ele alma biçimi. Geçerli değerler aşağıda belirtilmiştir:

  • APPEND: Belirtilmemiş içerik alanlarını şablona ekler
  • IGNORE: Belirtilmemiş içerik alanlarını yok say

    Varsayılan değer UYGULAMA'dır.

8. Veri geçişini planla

Geçiş, bağlayıcının veri kaynağındaki içeriği (bu durumda CSV dosyası) keşfetme sürecidir. CSV bağlayıcısı çalışırken, bir CSV dosyasının satırlarına göz atar ve her satırı Dizine Ekleme API'si aracılığıyla Cloud Search'e dizine ekler.

Tam geçiş, dosyadaki tüm sütunları dizine ekler. Artımlı geçiş yalnızca önceki geçişten sonra eklenen veya değiştirilen sütunları dizine ekler. CSV bağlayıcısı yalnızca tam geçiş yapar. Bu, artımlı geçiş yapmaz.

Planlama parametreleri, bağlayıcının geçişler arasında ne sıklıkta bekleneceğini belirler. Yapılandırma dosyası planlama parametreleri içermiyorsa varsayılan değerler kullanılır. Aşağıdaki tabloda bu parametreler gösterilmektedir.

Tema Parametre
Bir aradan sonra tam geçiş schedule.traversalIntervalSecs=7200

Bağlayıcı, belirli bir aralıktan sonra tam geçiş gerçekleştirir. Çapraz geçişler arasındaki aralığı saniye cinsinden belirtin. Varsayılan değer 86400'dür (bir gündeki saniye sayısı).

Bağlayıcı başlatıldığında tam geçiş schedule.performansTraversalOnStart=false

Bağlayıcı, ilk başlatma süresinin sona ermesini beklemek yerine, bağlayıcı başlatıldığında tam geçiş gerçekleştirir. Varsayılan değer, true (doğru) değeridir.

9. Erişim Denetimi Listesi (EKL) seçeneklerini belirtin

Google Cloud Search CSV bağlayıcısı, arama sonuçlarında CSV dosyasının içeriğine erişimi kontrol etmek için EKL'ler aracılığıyla verilen izinleri destekler. Dizine eklenen kayıtlara kullanıcı erişimini korumanızı sağlayan birden fazla EKL seçeneği vardır.

Deponuzda her belgeyle ilişkilendirilmiş ayrı EKL bilgileri varsa Cloud Search'te belge erişimini kontrol etmek için tüm EKL bilgilerini yükleyin. Deponuz kısmi EKL bilgileri sağlıyorsa veya hiç bilgi içermiyorsa SDK'nın bağlayıcıya sağladığı aşağıdaki parametrelerde varsayılan EKL bilgilerini sağlayabilirsiniz.

Bağlayıcı, yapılandırma dosyasında etkinleştirilen varsayılan EKL'leri temel alır. Varsayılan EKL'leri etkinleştirmek için defaultAcl.mode özelliğini none dışındaki bir moda ayarlayın ve defaultAcl.* ile yapılandırın

Tema Parametre
EKL modu defaultAcl.mode=yedek

Zorunlu. CSV bağlayıcısı Varsayılan EKL işlevini kullanır. Bağlayıcı yalnızca yedek modunu destekler.

Varsayılan EKL Adı defaultAcl.name=VIRTUAL_CONTAINER_FOR_CONNECTOR_1

İsteğe bağlı. Varsayılan EKL'leri ayarlamak için bağlayıcı tarafından kullanılan sanal container adını geçersiz kılmaya olanak tanır. Varsayılan değer "DEFAULT_ACL_VIRTUAL_CONTAINER" şeklindedir. Aynı veri kaynağında birden fazla bağlayıcıyı dizine ekleyen içerik varsa bu değeri geçersiz kılabilirsiniz.

Varsayılan herkese açık EKL defaultAcl.public=true

Deponun tamamı için kullanılan varsayılan EKL kamu alanı erişimi olarak ayarlanır. Varsayılan değer, false (yanlış) değeridir.

Ortak EKL grubu okuyucular defaultAcl.readers.groups=google:group1, group2
Ortak EKL okuyucular defaultAcl.readers.users=user1, user2, google:user3
Ortak EKL reddedilen grup okuyucular defaultAcl.denied.groups=group3
Yaygın EKL okuyucuları defaultAcl.denied.users=user4, user5
Alan adının tamamına erişim Dizine eklenen her kaydın, alandaki her kullanıcı tarafından herkes tarafından erişilebilir olduğunu belirtmek için aşağıdaki iki seçeneği de değerlerle ayarlayın:
  • defaultAcl.mode=yedek
  • defaultAcl.public=doğru
Ortak tanımlı EKL Veri deposunun her bir kaydı için bir EKL belirtmek amacıyla aşağıdaki parametre değerlerinin tümünü ayarlayın:
  • defaultAcl.mode=yedek
  • defaultAcl.public=yanlış
  • defaultAcl.readers.groups=google:group1, group2
  • defaultAcl.readers.users=user1, user2, google:user3
  • defaultAcl.denied.groups=group3
  • defaultAcl.denied.users=user4, user5

    Belirtilen her kullanıcı ve grup, önünde "google:" (sabit sabit) olmayan bir yerel alan tanımlı kullanıcı/grup olarak kabul edilir.

    Varsayılan kullanıcı veya grup boş bir dizedir. Kullanıcı ve grup seçeneklerini yalnızca defaultAcl.public false olarak ayarlandıysa sağlayın. Birden çok grubu ve kullanıcıyı listelemek için virgülle ayrılmış liste kullanın.

    defaultAcl.mode, none olarak ayarlanırsa kayıtlar, tanımlanan bağımsız EKL'ler olmadan aranamaz.

Şema Tanımı

Cloud Search, yapılandırılmış ve yapılandırılmamış içeriğin dizine eklenmesini ve sunulmasını sağlar. Verilerinizde yapılandırılmış veri sorgularını desteklemek üzere veri kaynağınız için Şemayı ayarlamanız gerekir.

Tanımlandıktan sonra CSV Bağlayıcısı, dizine ekleme istekleri oluşturmak için tanımlı şemaya başvurabilir. Örnek olarak, Filmler hakkında bilgi içeren bir CSV dosyası düşünelim.

CSV dosyasında aşağıdaki içeriğin bulunduğunu varsayalım.

  1. film kimliği
  2. filmBaşlığı
  3. açıklama
  4. yıl
  5. releaseDate
  6. aktörler (virgülle (,) ayrılmış birden fazla değer)
  7. tür (birden fazla değer)
  8. değerlendirme

Yukarıdaki veri yapısına dayanarak, verilerini CSV dosyasından dizine eklemek istediğiniz veri kaynağı için şema tanımlayabilirsiniz.

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

Örnek yapılandırma dosyası

Aşağıdaki örnek yapılandırma dosyası, örnek bağlayıcının davranışını tanımlayan key=value çiftlerini göstermektedir.

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

Her parametrenin ayrıntılı açıklamaları için Yapılandırma parametreleri referansına bakın.

Cloud Search CSV bağlayıcısını çalıştırma

Bağlayıcıyı komut satırından çalıştırmak için aşağıdaki komutu yazın:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

Varsayılan olarak, bağlayıcı günlükleri standart çıkışta kullanılabilir. logging.properties öğesini belirterek dosyalara giriş yapabilirsiniz.