Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından da sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanıyor ve belirli Windows paylaşımlarına erişecek şekilde yapılandırıyorsunuz. Tek bir bağlayıcı örneği birden fazla Microsoft Windows paylaşımını destekleyebilir.

Dikkat edilecek önemli noktalar

Sürekli otomatik güncellemeler

Varsayılan olarak bağlayıcı, başlatıldığında başlangıç yollarını (bağlayıcı yapılandırma dosyasındaki fs.src değerleri) sürekli olarak izler. Dosya sistemi, içerikte veya erişim kontrollerinde değişiklik olduğunu bildirdiğinde bağlayıcı, dosya sistemini yeniden taramak için tetiklenir. Bu yeniden tarama, kaynakların yoğun bir şekilde kullanılmasına yol açabilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdates seçeneğini false olarak ayarlayın. Konnektörün kaynak kullanımını önemli ölçüde azaltırsınız ancak konnektörün değişiklikleri yansıtması gecikir. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılarında erişim kontrolü uygular ve genellikle her DFS bağlantısının kendi ACL'si vardır. DFS'nin kullandığı mekanizmalardan biri, bir kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilen erişime dayalı numaralandırmadır (ABE). ABE, barındırılan ana dizinleri yalıttığında kullanıcılar yalnızca DFS bağlantılarının bir alt kümesini veya hatta yalnızca bir bağlantıyı alabilir. Bağlayıcı bir DFS sistemini geçtiğinde DFS bağlantısı ACL'sine ve hedefin Paylaşım ACL'sine uyar. Paylaşım ACL'si, DFS ACL'sinden devralınır.

Bilinen sınırlamalar

  • Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenmiş sürücüleri ve yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü düzgün çalışmıyor. Bazı erişim kontrol listeleri doğru şekilde okunmuyor.
  • Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Ancak bağlayıcı, DFS bağlantılarını yalnızca DFS ad alanında destekler. DFS ad alanındaki normal klasörlerde desteklemez.
  • cloudsearch.google.com'da döndürülen dosya bağlantıları tıklanamıyor. Query API tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanamaz.

Sistem gereksinimleri

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Google Cloud Search Dosya Sistemleri bağlayıcısını çalıştıracak bilgisayarda Java JRE 1.8'in yüklü olması
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtılmış Dosya Sistemi (DFS)

Desteklenmez: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya yerel Linux dosya sistemi.

Bağlayıcıyı dağıtma

Ön koşullar

Cloud Search Dosya Sistemleri bağlayıcısını dağıtmadan önce ortamınızda aşağıdaki ön koşul bileşenlerinin bulunduğundan emin olun:

Gerekli Microsoft Windows hesabı izinleri

Bağlayıcının çalıştığı Microsoft Windows hesabının aşağıdaki işlemleri gerçekleştirmek için yeterli izinlere sahip olması gerekir:

  • Klasörlerin içeriğini listeleme
  • Belgelerin içeriğini okuma
  • Dosya ve klasörlerin özelliklerini okuma
  • Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
  • Temel özellikler için yazma izinleri

Aşağıdaki gruplardan birine üye olmak, bir Windows hesabına bağlayıcı için gereken yeterli izinleri verir:

  • Yöneticiler
  • Deneyimli Kullanıcılar
  • Yazdırma Operatörleri
  • Sunucu Operatörleri

1. Adım: Google Cloud Search File Systems bağlayıcısını yükleme

  1. Bağlayıcı deposunu GitHub'dan alın ve oluşturun.

    Windows sunucusunda git'i kullanmak için:

    1. Kod deposunu klonlayın:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Bağlayıcının istediğiniz sürümünü kontrol edin:

      > git checkout tags/v1-0.0.3

    Doğrudan GitHub'dan indirmek için:

    1. https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
    2. Klonla veya indir Zip dosyasını indir'i tıklayın.
    3. Paketi açın.
    4. Yeni dizine gidin:
      > cd windows-filesystems-connector
  2. Bağlayıcıyı oluşturun. Gerekirse Apache Maven'ı yükleyin.

    > mvn package

    Bağlayıcıyı oluştururken testleri atlamak için mvn package yerine mvn package -DskipTests komutunu çalıştırın.

  3. Bağlayıcı ZIP dosyasını yerel yükleme dizininize kopyalayın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. adım: Bağlayıcı yapılandırma dosyasını oluşturma

  1. Bağlayıcı yüklemesiyle aynı dizinde bir dosya oluşturun ve dosyayı connector-config.properties olarak adlandırın.

  2. Dosya içeriğine aşağıdaki örnekte gösterildiği gibi anahtar/değer çiftleri olarak parametreler ekleyin:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Her parametrenin ayrıntılı açıklaması için yapılandırma parametreleri referansına gidin.

  3. (İsteğe bağlı) Diğer bağlayıcı parametrelerini gerektiği gibi yapılandırın. Ayrıntılar için Google tarafından sağlanan bağlayıcı parametreleri başlıklı makaleyi inceleyin.

3. Adım: Günlük kaydını etkinleştir

  1. Bağlayıcı ikilisini içeren dizinde logs adlı bir klasör oluşturun.
  2. Bağlayıcı ikilisini içeren dizinde logging.properties adlı bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma

Varsayılan olarak bağlayıcı, her dosyanın medya türünü JDK tarafından sağlanan medya türü algılama özelliğiyle tespit etmeye çalışır. Microsoft Windows'da JDK, dosyaların medya türlerini belirlemek için Windows kayıt defterini kullanır. Kayıt defteri girişinin eksik olması, belirli dosyalar için boş bir medya türüyle sonuçlanabilir.

Gerekirse mevcut bağlamaları geçersiz kılan veya boş medya türünü engelleyen bir medya türü belirtebilirsiniz.

  1. Bağlayıcı dizininde mime-type.properties adlı bir Latin-1 şifreli dosya oluşturun.
  2. Dosya uzantılarını ve bunlara karşılık gelen medya türlerini aşağıdaki örneklerdeki gibi girin:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

5. adım: Dosya Sistemleri bağlayıcısını çalıştırın

Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra, ana makinede başlatmak için aşağıdaki örnekteki gibi bir komut çalıştırın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Varsayılandan farklıysa (connector-config.properties adlı ikiliyle aynı dizinde) yapılandırma dosyası yolunu belirtin.

Yapılandırma parametreleri referansı

Veri kaynağı erişimi

Yer Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcısının erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. Google Workspace yöneticisi tarafından GCDS kullanılarak Active Directory kimliklerinin senkronize edilmesi için ayarlanan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Yer Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator tarafından yapılandırılan sınırlayıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1'de bulunmayan karakterler kullanıyorsanız bunları Java Unicode kaçışlarıyla kodlayın.

Yol ayırıcı karakter

Yer Parametre
Yol ayırıcı karakter fs.src.separator=separator-character

Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmamış farklı bir sınırlayıcı (ör. virgül ",") ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak değerlendirilir.

Bağlayıcı davranışı

Yer Parametre
Windows alanı fs.supportedDomain=domain

GCDS ile ayarlanmış kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin.

Hesapları EKL'lere dahil etme fs.supportedAccounts=account-1[, account-2,...]

Yerleşik hesaplar olup olmadıklarına bakılmaksızın, ACL'lere dahil edilecek hesapların virgülle ayrılmış listesi.

Varsayılan değer BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users'dır.

Yerleşik hesapları erişim kontrol listelerinden hariç tutma fs.builtinGroupPrefix=prefix

Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer BUILTIN\\'dır.

Gizli dosya ve klasörlerin dizine eklenmesine izin ver fs.crawlHiddenFiles=boolean

Bağlayıcının gizli dosya ve klasörleri taramasına izin vermek için true olarak ayarlayın (Windows dosya sistemlerinde, DOS gizli özelliği ayarlanmışsa dosya veya klasör gizli olarak kabul edilir). Varsayılan değer false'dır.

Taranan klasör listelerinin ve DFS ad alanı numaralandırmalarının dizine eklenmesine izin verin fs.indexFolders=boolean

true (varsayılan) olarak ayarlandığında bağlayıcı bir klasörü taradığında CONTAINER_ITEM nesnesi oluşturur. Yanlış olarak ayarlandığında bağlayıcı bunun yerine bir VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişikliği izlemeyi etkinleştirme fs.monitorForUpdates=boolean

true (varsayılan) olarak ayarlandığında, içerik veya erişim kontrollerinde yapılan değişiklikler bağlayıcının yeniden tarama yapmasına neden olur. İzlemeyi devre dışı bıraktığınızda (false olarak ayarlandığında) bağlayıcının kaynak kullanımı önemli ölçüde azalır ancak bağlayıcının değişiklikleri yansıtması gecikir.

Dizin önbelleğinin maksimum boyutunu ayarlama fs.directoryCacheSize=number-of-entries

Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosyaların ve klasörlerin dizine eklenmesini önlemek için gizli klasörleri tanımlamak üzere önbelleği kullanır.

Varsayılan değer 50.000 giriştir ve bu genellikle 10-15 megabayt RAM tüketir.

Zaman damgasını koruma ve tarama kontrolü

Yer Parametre
Son erişim zaman damgasını koru fs.preserveLastAccessTime=value

Bağlayıcı, dosya ve klasörleri taradığında bunların son erişim zaman damgasını tarama zamanına değiştirebilir. Son erişim zamanları korunmadığında, yedekleme ve arşiv sistemleri, bağlayıcının ziyareti nedeniyle uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir.

Bağlayıcı, varsayılan olarak son erişim zamanını korumaya çalışır (fs.preserveLastAccessTime ALWAYS olarak ayarlanır). Geçiş kullanıcısının dosya özelliklerini yazmak için yeterli ayrıcalığı olmadığında bağlayıcı, dosyanın son erişim zamanını geri yükleyemeyebilir. ALWAYS olarak ayarlandığında bağlayıcı, dosya sistemine yönelik tarama isteklerini reddeder. Böylece dosyaların son erişim zaman damgaları değiştirilmez.

Olası değerler:

  • ALWAYS: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bağlayıcı, son erişim zamanını ilk kez koruyamadığında son erişim zaman damgalarının değiştirilmesini önlemek için dosya sistemiyle ilgili sonraki tüm tarama isteklerini reddeder.
  • IF_ALLOWED: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgaları korunmasa bile tarama işlemine devam eder.
  • NEVER: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama fs.lastAccessedDate=YYYY-MM-DD

İçeriği yalnızca son erişim zamanı belirtilen tarihten sonra ise tarayın. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde (YYYY-AA-GG) belirtin. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra erişilen içerikleri tarar.

fs.lastAccessedDate özelliğini belirtirseniz fs.lastAccessedDays için de değer ayarlayamazsınız.

Yalnızca son günlerde erişilen dosyaları tarayın fs.lastAccessedDays=number-of-days

İçeriği yalnızca son erişim zamanı, şu anki tarihten önceki gün sayısı içindeyse tarayın. Varsayılan değer: disabled.

Bir süredir erişilmeyen, daha önce dizine eklenmiş içeriklerin süresini sona erdirmek için bu özelliği kullanın. Örneğin, içeriğin yalnızca son bir yıl içinde erişilmişse taranması için 365 olarak ayarlayın.

fs.lastAccessedDays özelliğini belirtirseniz fs.lastAccessedDate için de değer ayarlayamazsınız.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama fs.lastModifiedDate=YYYY-MM-DD

İçeriği yalnızca son değiştirilme zamanı belirtilen tarihten sonra ise tarayın. Varsayılan değer: disabled.

Tarihi ISO8601 tarih biçiminde (YYYY-AA-GG) belirtin. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra değiştirilen içerikleri tarar.

fs.lastModifiedDate özelliğini belirtirseniz fs.lastModifiedDays için de değer ayarlayamazsınız.

Yalnızca son günlerde değiştirilen dosyaları tarayın fs.lastModifiedDays=number-of-days

İçeriği yalnızca son değiştirme zamanı, şu anki tarihten önceki gün sayısı içindeyse tarayın. Varsayılan değer: disabled.

Bir süredir değiştirilmeyen, daha önce dizine eklenmiş içeriklerin süresini sona erdirmek için bu özelliği kullanın. Örneğin, içeriğin yalnızca son bir yıl içinde değiştirilmesi durumunda taranması için 365 olarak ayarlayın.

fs.lastModifiedDays özelliğini belirtirseniz fs.lastModifiedDate için de değer ayarlayamazsınız.

Dosya paylaşımı erişim denetimini atlama

Bağlayıcı, dosya paylaşımındaki EKL'ler de dahil olmak üzere erişim kontrol listelerini (EKL'ler) dizine ekleme API'sine gönderirken varsayılan olarak erişim kontrolü bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcı, paylaşım ACL'sini okumak için yeterli izne sahip olmayabilir. Bu durumlarda bağlayıcı, arama sonuçlarında söz konusu dosya paylaşımında tutulan dosyaları döndürmez.

İçeriğin her zaman arama sonuçlarında döndürülmesi için bağlayıcıyı paylaşım EKL'sini yoksayacak şekilde ayarlayabilirsiniz. Bu durumda, Indexing API, gerçek paylaşım EKL'si yerine tamamen izin verici bir paylaşım EKL'si alır.

Yer Parametre
Dosya paylaşımı erişim denetimini atlama fs.skipShareAccessControl=boolean

Paylaşım EKL'lerini zorunlu kılmak için false (varsayılan) olarak ayarlayın. Paylaşım EKL'lerini yoksaymak için true olarak ayarlayın.