Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanır ve belirtilen Windows paylaşımlarına erişmek için bunu yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.

Dikkat edilmesi gerekenler

Sürekli otomatik güncellemeler

Varsayılan olarak, bağlayıcı başlatıldığında, başlangıç yollarını (bağlayıcı yapılandırma dosyasındaki fs.src değerlerinden) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde yapılan değişiklikleri bildirdiğinde, bağlayıcı, dosya sistemini yeniden taraması için tetiklenir. Bu yeniden tarama yoğun kaynak kullanabilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdates değerini false olarak ayarlayın. Bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız, ancak bağlayıcı değişiklikleri yansıttığında gecikirsiniz. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılarına erişim denetimi uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS tarafından kullanılan mekanizmalardan biri, kullanıcıya döndürülen DFS bağlantılarını kısıtlayan Erişim Tabanlı Numaralandırma'dır (ABE). Kullanıcılar, ABE barındırılan ana dizinleri izole ettiğinde DFS bağlantılarının yalnızca bir alt kümesini veya yalnızca bir bağlantıyı alabilir. Bağlayıcı bir DFS sisteminde gezindiğinde, bağlayıcı DFS bağlantısı EKL'sine ve hedefin Paylaşım EKL'sine uyar. Paylaşım EKL'si de DFS EKL'den devralır.

Bilinen sınırlamalar

  • Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenen sürücüleri ve yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS ile eşlenmiş bir sürücü düzgün çalışmıyor. Bazı EKL'ler doğru okunmuyor.
  • Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Bununla birlikte, bağlayıcı yalnızca bir DFS ad alanındaki DFS bağlantılarını destekler, DFS ad alanındaki normal klasörleri desteklemez.
  • cloudsearch.google.com'da döndürülen dosya bağlantıları tıklanabilir değil. Sorgu API'sının döndürdüğü dosya bağlantıları da çoğu tarayıcıda tıklanabilir değildir.

Sistem gereksinimleri

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Google Cloud Search File Systems bağlayıcısını çalıştıracak bilgisayarda Java JRE 1.8 yüklü
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtılmış Dosya Sistemi (DFS)

Desteklenmez: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya Yerel Linux dosya sistemi.

Bağlayıcıyı dağıtma

Ön koşullar

Cloud Search Dosya Sistemleri bağlayıcısını dağıtmadan önce ortamınızda aşağıdaki tüm ön koşul bileşenlerinin bulunduğundan emin olun:

Gerekli Microsoft Windows hesap izinleri

Bağlayıcının çalıştığı Microsoft Windows hesabının, aşağıdaki işlemleri gerçekleştirmek için yeterli izni olmalıdır:

  • Klasörlerin içeriğini listeleme
  • Belgelerin içeriğini okuma
  • Dosyaların ve klasörlerin özelliklerini okuma
  • Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
  • Temel özellik izinlerini yazma

Aşağıdaki gruplardan birinin üyeliği, bir Windows hesabına bağlayıcı için gereken yeterli izinleri sağlar:

  • Yöneticiler
  • Deneyimli Kullanıcılar
  • Yazdırma Operatörleri
  • Sunucu Operatörleri

1. Adım: Google Cloud Search Dosya Sistemleri bağlayıcısını yükleme

  1. GitHub'dan bağlayıcı deposunu alın ve derleyin.

    Git'i Windows sunucusunda kullanmak için:

    1. Kod deposunu klonlayın:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Bağlayıcının istenen sürümünü kontrol edin:

      > git checkout tags/v1-0.0.3

    Doğrudan GitHub'dan indirmek için:

    1. https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
    2. Klonla veya indir Zip dosyasını indir'i tıklayın.
    3. Paketin sıkıştırmasını açın.
    4. Yeni dizine taşı:
      > cd windows-filesystems-connector
  2. Bağlayıcıyı oluşturun. Gerekirse Apache Maven'i yükleyin.

    > mvn package

    Bağlayıcıyı derlerken testleri atlamak için mvn package yerine mvn package -DskipTests komutunu çalıştırın.

  3. Bağlayıcı ZIP dosyasını yerel yükleme dizininize kopyalayın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. adım: Bağlayıcı yapılandırma dosyasını oluşturma

  1. Bağlayıcı kurulumuyla aynı dizinde bir dosya oluşturun ve dosyaya connector-config.properties adını verin.

  2. Parametreleri, aşağıdaki örnekte olduğu gibi dosya içeriğine anahtar/değer çiftleri olarak ekleyin:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Her parametrenin ayrıntılı açıklamaları için yapılandırma parametreleri referansına gidin.

  3. (İsteğe bağlı) Diğer bağlayıcı parametrelerini gerektiği gibi yapılandırın. Ayrıntılar için Google'ın sağladığı bağlayıcı parametreleri bölümüne gidin.

3. adım: Günlük kaydını etkinleştir

  1. Bağlayıcı ikili kodunu içeren dizinde logs adlı bir klasör oluşturun.
  2. Bağlayıcı ikili programını içeren dizinde logging.properties adlı bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım: (İsteğe bağlı) Medya türlerini yapılandırma

Varsayılan olarak bağlayıcı, JDK tarafından sağlanan medya türü algılamasıyla her bir dosyanın medya türünü algılamaya çalışır. Microsoft Windows'da JDK, dosyaların medya türlerini belirlemek için Windows kayıt defterini kullanır. Eksik kayıt defteri girişi, belirli dosyalar için boş medya türüyle sonuçlanabilir.

Gerekirse mevcut bağlamaların üzerine yazan veya boş medya türünü önleyen bir medya türü belirtebilirsiniz.

  1. Bağlayıcı dizininde mime-type.properties adlı, Latin-1 şifreli bir dosya oluşturun.
  2. Aşağıdaki örneklerde olduğu gibi dosya uzantılarını ve ilgili medya türlerini girin:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın

Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra, ana makinede başlatmak için aşağıdaki örnekteki gibi bir komut çalıştırın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Varsayılandan farklıysa yapılandırma dosyası yolunu belirtin (connector-config.properties adlı ikili programla aynı dizinde).

Yapılandırma parametreleri referansı

Veri kaynağı erişimi

Ayar Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği.

Hizmet hesabı özel anahtar dosyasının yolu api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. Google Workspace yöneticisi tarafından GCDS kullanılarak etkin dizin kimliklerini senkronize etmek için ayarlanan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Ayar Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator ile yapılandırılan sınırlayıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1'de olmayan karakterler kullanırsanız, bunları Java Unicode çıkışları ile kodlayın.

Yol ayırıcı karakteri

Ayar Parametre
Yol ayırıcı karakteri fs.src.separator=separator-character

Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyasının söz diziminin kendisi tarafından ayrılmayan virgül (",") gibi farklı bir ayırıcı ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak değerlendirilir.

Bağlayıcı davranışı

Ayar Parametre
Windows alanı fs.supportedDomain=domain

GCDS ayarlarını yapan kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin.

EKLS'deki hesapları dahil et fs.supportedAccounts=account-1[, account-2,...]

Yerleşik hesap olup olmadıklarına bakılmaksızın EKL'lere dahil edilecek hesapların virgülle ayrılmış listesi.

Varsayılan değer: BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

Yerleşik hesapları EKL'lerden hariç tut fs.builtinGroupPrefix=prefix

Yerleşik hesapların önekini belirtin. Bu önekle başlayan hesaplar yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer: BUILTIN\\

Gizli dosyaların ve klasörlerin dizine eklenmesine izin ver fs.crawlHiddenFiles=boolean

Bağlayıcının gizli dosya ve klasörleri taramasına izin vermek için bu değeri true olarak ayarlayın (Windows dosya sistemlerinde, gizli DOS özelliği ayarlanırsa bir dosya veya klasör gizli olarak kabul edilir.) Varsayılan değer false değeridir.

Taranan klasör girişlerinin ve DFS Ad Alanı numaralandırmalarının dizine eklenmesine izin ver fs.indexFolders=boolean

true (varsayılan) değerine ayarlandığında, bağlayıcı bir klasörü tararken bağlayıcı bir CONTAINER_ITEM nesnesi oluşturur. Politika yanlış değerine ayarlanırsa bağlayıcı bunun yerine bir VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişiklik izlemeyi etkinleştir fs.monitorForUpdates=boolean

true (varsayılan) değerine ayarlandığında, içerik veya erişim denetimlerinde yapılan değişiklikler bağlayıcının yeniden taranmasını tetikler. İzlemeyi kapattığınızda (false değerine ayarlandığında) bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız, ancak bağlayıcı değişiklikleri yansıttığında gecikme yaşarsınız.

Dizin önbelleklerinin maksimum boyutunu ayarla fs.directoryCacheSize=number-of-entries

Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosyaların ve klasörlerin dizine eklenmesini önlemek amacıyla gizli klasörleri tanımlamak için önbelleği kullanır.

Varsayılan değer 50.000 giriştir ve bu genellikle 10-15 megabayt RAM tüketir.

Zaman damgası koruması ve tarama denetimi

Ayar Parametre
Son erişim zaman damgasını koru fs.preserveLastAccessTime=value

Bağlayıcı, dosya ve klasörleri tararken bağlayıcı, dosyaların ve klasörlerin son erişim zaman damgasını tarama zamanıyla değiştirebilir. Son erişim zamanları korunmadığında, bağlayıcının ziyareti nedeniyle yedekleme ve arşiv sistemleri uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir.

Varsayılan olarak bağlayıcı, son erişim zamanını korumaya çalışır (fs.preserveLastAccessTime, ALWAYS olarak ayarlandı). Geçiş kullanıcısı, dosya özelliklerini yazmak için yeterli ayrıcalığa sahip olmadığında bağlayıcı, dosyanın son erişim zamanını geri yükleyemeyebilir. ALWAYS değerine ayarlandığında bağlayıcı, dosyaların son erişim zaman damgalarını değiştirmek için dosya sistemi için tarama isteklerini reddeder.

Olası değerler:

  • ALWAYS: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bağlayıcı, son erişim zamanını ilk kez koruyamadığında, son erişim zaman damgalarının değiştirilmesini önlemek için dosya sistemi için sonraki tüm tarama isteklerini reddeder.
  • IF_ALLOWED: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgaları korunmasa bile taramaya devam eder.
  • NEVER: Bağlayıcı, dosya ve klasörleri tararken son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tara fs.lastAccessedDate=YYYY-MM-DD

Yalnızca son erişim zamanı belirtilen tarihten sonraysa içeriği tara. disabled, varsayılan değerdir.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010 yılının başından sonra erişilen içeriği tarar.

fs.lastAccessedDate değerini belirtirseniz fs.lastAccessedDays için de bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde erişilen dosyaları tara fs.lastAccessedDays=number-of-days

Yalnızca son erişim zamanı gün öncesindeki gün sayısı içindeyse içeriği tara. disabled, varsayılan değerdir.

Bu özelliği, bir süredir erişilmeyen ve önceden dizine eklenmiş içeriğin sona ermesi için kullanın. Örneğin, yalnızca son bir yıl içinde erişilmiş olan içerikleri taramak için 365 olarak ayarlayın.

fs.lastAccessedDays değerini belirtirseniz fs.lastAccessedDate için de bir değer ayarlayamazsınız.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tara fs.lastModifiedDate=YYYY-MM-DD

Yalnızca son değiştirilme zamanı, belirtilen tarihten sonraysa içeriği tara. disabled, varsayılan değerdir.

Tarihi ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010 yılının başından sonra değiştirilen içeriği tarar.

fs.lastModifiedDate değerini belirtirseniz fs.lastModifiedDays için de bir değer ayarlayamazsınız.

Yalnızca son birkaç gün içinde değiştirilmiş dosyaları tara fs.lastModifiedDays=number-of-days

Yalnızca son değişiklik zamanı o tarihten önceki gün sayısı içindeyse içeriği tara. disabled, varsayılan değerdir.

Bu özelliği, önceden dizine eklenmiş olan ve bir süredir değiştirilmemiş içeriklerin geçerlilik süresini sona erdirmek için kullanın. Örneğin, yalnızca geçen yıl değiştirilen içerikleri taramak için 365 olarak ayarlayın.

fs.lastModifiedDays değerini belirtirseniz fs.lastModifiedDate için de bir değer ayarlayamazsınız.

Dosya paylaşımı erişim denetimini atla

Varsayılan olarak bağlayıcı, dosya paylaşımındaki EKL'ler de dahil olmak üzere, dizine ekleme API'sine Erişim Kontrol Listeleri (EKL'ler) gönderdiğinde erişim denetimi bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcı, paylaşım EKL'sini okumak için yeterli izne sahip olmayabilir. Bu tür durumlarda bağlayıcı, söz konusu dosya paylaşımında saklanan dosyaları arama sonuçlarında döndürmez.

İçeriğin arama sonuçlarında her zaman döndürülmesi için bağlayıcıyı paylaşım EKL'sini yoksayacak şekilde ayarlayabilirsiniz. Bu durumda, dizine ekleme API'si gerçek paylaşım EKL'si yerine tamamen geniş kapsamlı bir paylaşım EKL'si alır.

Ayar Parametre
Dosya paylaşımı erişim denetimini atla fs.skipShareAccessControl=boolean

Paylaşım EKL'lerini zorunlu kılmak için false (varsayılan) olarak ayarlayın. Paylaşılan EKL'leri yoksaymak için true olarak ayarlayın.