Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanıp belirtilen Windows paylaşımlarına erişmek için bu bağlayıcıyı yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.

Dikkat edilmesi gerekenler

Sürekli otomatik güncellemeler

Varsayılan olarak, bağlayıcı başlatıldığında başlangıç yollarını (bağlayıcı yapılandırması dosyasındaki fs.src değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde değişiklik yaptığında, bağlayıcı, dosya sistemini yeniden taramak üzere tetiklenir. Bu yeniden tarama, kaynak yoğun olabilir. Dosya sistemi izlemeyi kapatmak için fs.monitorForUpdates değerini false olarak ayarlayın. Bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız ancak bağlayıcı değişiklikleri yansıttığında gecikme oluşur. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılara erişim denetimini uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS'nin kullandığı mekanizmalardan biri, bir kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilecek Erişim Tabanlı Sıralama'dır (ABE). Kullanıcılar, yalnızca DFS Bağlantılarının bir alt kümesini veya ABE tarafından barındırılan ana dizinleri izole ettiğinde bir bağlantı alabilir. Bağlayıcı bir DFS sisteminden geçtiğinde, bağlayıcı DFS bağlantı EKL'sine ve hedefin Paylaşım EKL'sine uyar ve Paylaşım EKL'si DFS EKL'den devralır.

Bilinen sınırlamalar

  • Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenmiş sürücüleri ve yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü doğru çalışmıyor. Bazı EKL'ler doğru şekilde okunmuyor.
  • Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantıları destekler. Bununla birlikte, bağlayıcı yalnızca DFS ad alanındaki DFS bağlantılarını destekler, DFS ad alanındaki normal klasörleri desteklemez.
  • cloudsearch.google.com'da döndürülen dosya bağlantıları tıklanabilir değildir. Query API tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanabilir değildir.

Sistem gereksinimleri

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Google Cloud Search Dosya Sistemleri bağlayıcısını çalıştıracak bilgisayarda Java JRE 1.8 yüklü olmalıdır
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtılmış Dosya Sistemi (DFS)

Desteklenmiyor: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya Yerel Linux dosya sistemi.

Bağlayıcıyı dağıtma

Ön koşullar

Cloud Search File Systems bağlayıcısını dağıtmadan önce ortamınızın aşağıdaki ön koşul bileşenlerinin tümüne sahip olduğundan emin olun:

Gerekli Microsoft Windows hesap izinleri

Bağlayıcının çalıştırıldığı Microsoft Windows hesabı, aşağıdaki işlemleri gerçekleştirmek için yeterli izne sahip olmalıdır:

  • Klasörlerin içeriğini listeleme
  • Belgelerin içeriğini okuma
  • Dosya ve klasörlerin özelliklerini okuma
  • Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
  • Temel özellik izinlerini yazma

Aşağıdaki gruplardan birine üye olmak, bir Windows hesabına bağlayıcının ihtiyaç duyduğu yeterli izinleri sağlar:

  • Yöneticiler
  • Deneyimli Kullanıcılar
  • Baskı Operatörleri
  • Sunucu Operatörleri

1. Adım: Cloud Search File Systems bağlayıcısını yükleme

  1. Bağlayıcı deposunu GitHub'dan alın ve oluşturun.

    Windows sunucusunda git kullanmak için:

    1. Kod deposunu klonlayın:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Bağlayıcının istediğiniz sürümüne göz atın:

      > git checkout tags/v1-0.0.3

    Doğrudan GitHub'dan indirmek için:

    1. https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
    2. Klonla veya indir Zip dosyasını indir'i tıklayın.
    3. Sıkıştırılmış paketi açın.
    4. Yeni dizine gidin:
      > cd windows-filesystems-connector
  2. Bağlayıcıyı oluşturun. Gerekirse Apache Maven'ı yükleyin.

    > mvn package

    Bağlayıcıyı oluştururken testleri atlamak için mvn package yerine mvn package -DskipTests komutunu çalıştırın.

  3. Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. Adım. Bağlayıcı yapılandırma dosyası oluşturma

  1. Bağlayıcı kurulumuyla aynı dizinde bir dosya oluşturun ve bu dosyaya connector-config.properties adını verin.

  2. Parametreleri aşağıdaki örnekte olduğu gibi dosya içeriğine anahtar/değer çifti olarak ekleyin:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Her parametrenin ayrıntılı açıklamaları için yapılandırma parametreleri referansına gidin.

  3. (İsteğe bağlı) Gerektiğinde diğer bağlayıcı parametrelerini yapılandırın. Ayrıntılar için Google tarafından sağlanan bağlayıcı parametreleri bölümüne bakın.

3. Adım. Günlük kaydını etkinleştir

  1. Bağlayıcı ikili programını içeren dizinde logs adlı bir klasör oluşturun.
  2. Bağlayıcı ikili programını içeren dizinde logging.properties adında bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma

Bağlayıcı, varsayılan olarak her bir dosyanın medya türünü JDK tarafından sağlanan medya türü algılama teknolojisiyle algılamaya çalışır. Microsoft Windows'da JDK, dosyalar için medya türlerini belirlemek amacıyla Windows kayıt defterine güvenir. Eksik kayıt defteri girişi, belirli dosyalar için boş değerli medya türüyle sonuçlanabilir.

Gerekirse mevcut bağlamaların üzerine yazan veya boş bir medya türünü önleyen bir medya türü belirtebilirsiniz.

  1. Bağlayıcı dizininde mime-type.properties adlı bir Latin-1 şifreli dosya oluşturun.
  2. Aşağıdaki örneklerde gösterildiği gibi dosya uzantılarını ve karşılık gelen medya türlerini girin:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın

Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra ana makinede başlatmak için aşağıdaki örneğe benzer bir komut çalıştırın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Varsayılandan farklı ise yapılandırma dosyası yolunu belirtin (connector-config.properties adlı ikili programla aynı dizin).

Yapılandırma parametreleri referansı

Veri kaynağı erişimi

Tema Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcısı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. Etkin dizin kimliklerini GCDS ile senkronize etmek için Google Workspace yöneticisi tarafından oluşturulan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Tema Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator tarafından yapılandırılan sınırlayıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1 dilinde olmayan karakterler kullanıyorsanız, bu karakterleri Java Unicode çıkışları ile kodlayın.

Yol ayırıcı karakter

Tema Parametre
Yol ayırıcı karakter fs.src.separator=separator-character

Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmayan virgül (",") gibi farklı bir sınır ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak değerlendirilir.

Bağlayıcı davranışı

Tema Parametre
Windows alanı fs.supportedDomain=domain

GCDS ile oluşturulan kullanıcıların dokümanlara Cloud Search üzerinden erişmesine izin verilmesi gerekir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin.

EKL'lerdeki hesapları dahil et fs.supportedAccounts=account-1[, account-2,...]

EKL'lere eklenecek hesapların virgülle ayrılmış listesi (yerleşik hesaplar olup olmamasına bakılmaksızın).

Varsayılan değer BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users değeridir

Yerleşik hesapları EKL'lerden hariç tutma fs.builtinGroupPrefix=prefix

Yerleşik hesapların ön ekini belirtin. Bu ön ekle başlayan bir hesap, yerleşik bir hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer BUILTIN\\ değeridir

Gizli dosyaların ve klasörlerin dizine eklenmesine izin verme fs.crawlHiddenFiles=boolean

Bağlayıcının gizli dosyaları ve klasörleri taramasına izin vermek için true olarak ayarlayın (Windows dosya sistemlerinde, DOS gizli özelliği ayarlanmışsa bir dosya veya klasörün gizli olduğu kabul edilir.) Varsayılan değer false değeridir.

Taranan klasör girişlerinin ve DFS Ad Alanı sıralamalarının dizine eklenmesine izin ver fs.indexFolders=boolean

true (varsayılan) olarak ayarlandığında, bağlayıcı bir klasörü taradığında bağlayıcı, bir CONTAINER_ITEM nesnesi oluşturur. False olarak ayarlandığında, bağlayıcı bunun yerine VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişikliği izlemeyi etkinleştir fs.monitorForUpdates=boolean

true (varsayılan) değerine ayarlandığında, içerik veya erişim denetimlerinde yapılan değişiklikler bağlayıcının yeniden taranmasını tetikler. İzlemeyi kapattığınızda (false olarak ayarlanırsa) bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız ancak bağlayıcı değişiklikleri yansıttığında gecikme oluşur.

Dizin önbelleğinin maksimum boyutunu ayarlama fs.directoryCacheSize=number-of-entries

Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörleri tanımlamak için bu önbelleği kullanır.

Varsayılan değer 50.000 giriştir. Bu girişler genellikle 10-15 megabayt RAM kullanır.

Zaman damgası koruması ve tarama kontrolü

Tema Parametre
Son erişim zaman damgasını koru fs.preserveLastAccessTime=value

Bağlayıcı, dosya ve klasörleri taradığında, dosyaların ve klasörlerin son erişim zaman damgasını tarama sırasında değiştirebilir. Son erişim süreleri korunmadığında, yedekleme ve arşivleme sistemleri, bağlayıcının ziyaretinden dolayı uygun dosyaları ve klasörleri ikincil depolama alanına taşımayabilir.

Varsayılan olarak, bağlayıcı son erişim zamanını korumaya çalışır (fs.preserveLastAccessTime, ALWAYS olarak ayarlanmıştır). Çapraz kullanıcı, dosya özelliklerini yazmak için yeterli ayrıcalığa sahip olmadığında bağlayıcı, dosyanın son erişim zamanını geri yükleyemeyebilir. ALWAYS olarak ayarlandığında bağlayıcı, dosya sisteminin tarama isteklerini reddeder. Böylece dosyalar son erişim zaman damgalarını değiştirmez.

Olası değerler:

  • ALWAYS: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bağlayıcı son erişim saatini ilk kez koruyamadığında, son erişim zaman damgalarının değiştirilmesini engellemek için dosya sistemine yönelik sonraki tüm tarama istekleri reddedilir.
  • IF_ALLOWED: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgaları korunmuyor olsa bile taramaya devam eder.
  • NEVER: Bağlayıcı, dosyaları ve klasörleri taradığından son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama fs.lastAccessedDate=YYYY-MM-DD

Yalnızca son erişim zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer disabled değeridir.

Tarihi, ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra erişilen içeriği tarar.

fs.lastAccessedDate değerini belirtirseniz fs.lastAccessedDays için bir değer de ayarlayamazsınız.

Yalnızca son birkaç gün içinde erişilen dosyalar fs.lastAccessedDays=number-of-days

Yalnızca son erişim zamanı, mevcut günlerden önce olan gün sayısı içindeyse içeriği tarar. Varsayılan değer disabled değeridir.

Bir süredir erişilmemiş, önceden dizine eklenen içeriğin süresini sona erdirmek için bu özelliği kullanın. Örneğin, yalnızca geçen yıl erişildiğinde içeriği taramak için 365 olarak ayarlayın.

fs.lastAccessedDays değerini belirtirseniz fs.lastAccessedDate için bir değer de ayarlayamazsınız.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama fs.lastModifiedDate=YYYY-MM-DD

Yalnızca son değiştirme zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer disabled değeridir.

Tarihi, ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başlangıcından sonra değiştirilen içeriği tarar.

fs.lastModifiedDate değerini belirtirseniz fs.lastModifiedDays için bir değer de ayarlayamazsınız.

Yalnızca son birkaç gün içinde değiştirilmiş dosyaları tara fs.lastModifiedDays=number-of-days

Yalnızca son değiştirme zamanı, mevcut gün sayısı dahilindeyse içeriği tarar. Varsayılan değer disabled değeridir.

Bir süre önce değiştirilmemiş, önceden dizine eklenmiş içeriğin geçerliliğini sona erdirmek için bu özelliği kullanın. Örneğin, yalnızca geçen yıl değiştirilmişse içeriği taramak için 365 olarak ayarlayın.

fs.lastModifiedDays değerini belirtirseniz fs.lastModifiedDate için bir değer de ayarlayamazsınız.

Dosya paylaşımı erişim kontrolünü atla

Varsayılan olarak, bağlayıcı, dosya paylaşımındaki EKL'ler dahil olmak üzere, Erişim Kontrol Listelerini (EKL'ler) dizine ekleme API'sine gönderdiğinde erişim kontrolü bütünlüğünü korur. Ancak bazı yapılandırmalarda, bağlayıcı EKL'yi okumak için yeterli izinlere sahip olmayabilir. Böyle durumlarda bağlayıcı, arama sonuçlarında söz konusu dosya paylaşımında saklanan dosyaları döndürmez.

Bağlayıcıyı, paylaşım EKL'sini yok sayacak şekilde ayarlayabilirsiniz, böylece içerik her zaman arama sonuçlarında döndürülür. Bu durumda, dizine ekleme API'si, gerçek paylaşım EKL'si yerine tamamen serbest bir paylaşım EKL'si alır.

Tema Parametre
Dosya paylaşımı erişim kontrolünü atla fs.skipShareAccessControl=boolean

Paylaşım EKL'lerini zorunlu kılmak için false (varsayılan) olarak ayarlayın. Paylaşım EKL'lerini yoksaymak için true olarak ayarlayın.