Microsoft Windows Dosya Sistemleri bağlayıcısını dağıtma

Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından da sonuç döndürecek şekilde ayarlayabilirsiniz. Cloud Search File Systems bağlayıcısını kullanır ve belirli Windows paylaşımlarına erişmek için bağlayıcıyı yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.

Dikkat edilecek önemli noktalar

Dosya Sistemleri bağlayıcısını dağıtmadan önce aşağıdaki noktaları gözden geçirin.

Sürekli otomatik güncellemeler

Bağlayıcı, varsayılan olarak başlatıldığında başlangıç yollarını (yapılandırma dosyasındaki fs.src değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde değişiklik olduğunu bildirdiğinde bağlayıcı, dosya sistemini yeniden tarar. Bu yeniden tarama, kaynak açısından yoğun olabilir. İzlemeyi devre dışı bırakmak için fs.monitorForUpdates değerini false olarak ayarlayın. Bu, kaynak kullanımını azaltır ancak bağlayıcının değişiklikleri yansıtmasını geciktirir. Daha fazla bilgi

DFS erişim denetimi

DFS sistemi, bağlantılarında erişim kontrolü uygular ve genellikle her DFS bağlantısının kendi ACL'si vardır. DFS, bir kullanıcıya döndürülen bağlantıları kısıtlamak için erişime dayalı numaralandırma (ABE) kullanır. ABE, ana dizinleri yalıttığında kullanıcılar DFS bağlantılarının yalnızca bir alt kümesini veya yalnızca bir bağlantıyı görebilir. DFS sisteminde gezinirken bağlayıcı, DFS bağlantı EKL'sine ve hedefin paylaşım EKL'sine uyar. Paylaşım EKL'si, DFS EKL'sinden devralınır.

Bilinen sınırlamalar

Bu bölümde, dosya sistemi bağlayıcısının bilinen sınırlamaları listelenmektedir.

  • Dosya sistemi: Bağlayıcı, eşlenmiş veya yerel sürücüleri desteklemez.
  • Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü doğru çalışmıyor ve bazı ACL'ler doğru şekilde okunmuyor.
  • Bağlayıcı, DFS ad alanındaki normal klasörleri değil, DFS ad alanlarını ve bağlantılarını destekler.
  • cloudsearch.google.com içindeki veya Query API tarafından döndürülen dosya bağlantıları çoğu tarayıcıda tıklanamaz.

Sistem gereksinimleri

Dosya Sistemleri bağlayıcısını dağıtmadan önce, ana makinenin aşağıdaki koşulları karşıladığından emin olun:

Sistem gereksinimleri
İşletim sistemi
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Yazılım
  • Bağlayıcıyı çalıştıran bilgisayarda Java JRE 1.8 yüklü olmalıdır.
Dosya sistemi protokolleri
  • Sunucu İleti Bloğu (SMB) - SMB1
  • Sunucu İleti Bloğu (SMB) - SMB2
  • Dağıtılmış Dosya Sistemi (DFS)

Desteklenmez: Yerel Windows dosya sistemleri, NFS 2.0, NFS 3.0 veya yerel Linux dosya sistemleri.

Bağlayıcıyı dağıtma

Dosya Sistemleri bağlayıcısını dağıtmak için aşağıdaki adımları uygulayın.

Ön koşullar

Bağlayıcıyı dağıtmadan önce ortamınızda aşağıdaki bileşenlerin bulunduğundan emin olun:

  • Bağlantı oluşturmak için Google Workspace bilgileri:

    Bu kimlik bilgilerini genellikle Google Workspace yöneticiniz sağlayabilir.

  • Windows hesabının yeterli izinlere sahip olduğundan emin olun.

Gerekli Microsoft Windows hesabı izinleri

Bağlayıcıyı çalıştıran Windows hesabının şu izinlere sahip olması gerekir:

  • Klasör içeriğini listeleme
  • Belge içeriğini okuma
  • Dosya ve klasör özelliklerini okuma.
  • Dosya ve klasörler için okuma izinleri (EKL'ler).
  • Temel özellikleri yazma.

Bu gruplardan birine üye olmak genellikle yeterli izinleri verir: Yöneticiler, Güçlü Kullanıcılar, Yazdırma Operatörleri veya Sunucu Operatörleri.

1. Adım: Bağlayıcıyı yükleme

Bağlayıcı deposunu GitHub'dan indirin veya kopyalayın, ardından bağlayıcı paketini oluşturun.

  1. Bağlayıcı deposunu GitHub'dan alın ve oluşturun.

    Windows sunucusunda git'i kullanmak için:

    > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
    > cd windows-filesystems-connector
    > git checkout tags/v1-0.0.3

    Doğrudan indirmek için:

    1. windows-filesystems-connector adresine gidin.
    2. Klonla veya indir > Zip olarak indir'i tıklayın.
    3. Paketin zip dosyasını açın ve dizine gidin.
  2. Apache Maven kullanarak bağlayıcıyı oluşturun:

    > mvn package
    Testleri atlamak için mvn package -DskipTests simgesini kullanın.

  3. Bağlayıcı ZIP dosyasını kurulum dizininize çıkarın:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

2. adım: Yapılandırma dosyasını oluşturma

Bağlayıcıyı yükledikten sonra, bağlayıcı ayarlarını içeren bir yapılandırma dosyası oluşturun.

  1. Bağlayıcı dizininde adlı bir dosya oluşturun. connector-config.properties
  2. Parametreleri anahtar/değer çiftleri olarak ekleyin. Örneğin:

    # Required parameters
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # File system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace
    
    # Optional parameters
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Dosya sistemine özgü parametreler için Yapılandırma parametreleri referansı'na bakın. Tüm Cloud Search bağlayıcıları tarafından kullanılan ortak parametrelerin listesi için Google tarafından sağlanan bağlayıcı parametreleri başlıklı makaleyi inceleyin.

3. Adım: Günlük kaydını etkinleştir

Günlükler için bir dizin ve günlük kaydı yapılandırma dosyası oluşturun.

  1. Bağlayıcı dizininde logs adlı bir klasör oluşturun.
  2. logging.properties adlı bir dosya oluşturun ve şu içeriği ekleyin:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma

Bağlayıcı, Windows'da kayıt defteri girişlerine dayanan varsayılan mekanizmasını kullanarak dosya medya türlerini algılamaya çalışır. Bir dosya uzantısı için kayıt defteri girişi eksikse bağlayıcı, medya türünü doğru şekilde algılayamayabilir. Medya türleri doğru şekilde algılanmıyorsa veya bir uzantının varsayılan türünü geçersiz kılmak istiyorsanız aşağıdaki adımları uygulayın:

  1. Bağlayıcı dizininde mime-type.properties adlı bir dosya oluşturun.
  2. Uzantıları ve türleri extension=media/type olarak girin: properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf

5. Adım: Dosya sistemleri bağlayıcısını çalıştırma

Bağlayıcıyı ana makineden başlatın:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Bağlayıcı, varsayılan olarak bağlayıcının çalıştırıldığı dizinde connector-config.properties adlı bir yapılandırma dosyası arar. Yapılandırma dosyanızın adı farklıysa veya başka bir dizindeyse, yolunu belirtmek için -Dconfig parametresini kullanın.

Yapılandırma parametreleri referansı

Aşağıdaki tablolarda, Dosya Sistemleri bağlayıcısını yapılandırmak için kullanılan parametreler listelenmekte ve açıklanmaktadır.

Veri kaynağı erişimi

Ayar Parametre
Veri kaynağı kimliği api.sourceId=1234567890abcdef

Zorunlu. Cloud Search kaynak kimliği.

Hizmet hesabı api.serviceAccountPrivateKeyFile=./PrivateKey.json

Zorunlu. Hizmet hesabı anahtar dosyasının yolu.

Kimlik kaynağı kimliği api.identitySourceId=x0987654321

Zorunlu. Google Workspace yöneticisi tarafından GCDS kullanılarak Active Directory kimliklerinin senkronize edilmesi için ayarlanan Cloud Search kimlik kaynağı kimliği.

Dosya sistemi erişimi

Tarama yapılacak dosya sistemi kaynaklarını belirtmek için bu parametreleri kullanın.

Ayar Parametre
Kaynak dosya sistemleri fs.src=path1[,path2, ...]

Zorunlu. Kaynak dosya sistemlerini, fs.src.separator tarafından yapılandırılan sınırlayıcıyla ayrılmış bir veya daha fazla UNC kaynağı olarak belirtin. Latin1'de bulunmayan karakterler kullanıyorsanız bunları Java Unicode kaçışlarıyla kodlayın.

Yol ayırıcı karakter

Ayar Parametre
Yol ayırıcı karakter fs.src.separator=separator-character

Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmamış farklı bir sınırlayıcı (ör. virgül ",") ayarlayabilirsiniz.

fs.src.separator değeri boş bir dizeyse fs.src değeri tek bir yol olarak değerlendirilir.

Bağlayıcı davranışı

Bağlayıcının dosya sistemlerini nasıl tarayacağını ayarlamak için bu parametreleri kullanın.

Ayar Parametre
Windows alanı fs.supportedDomain=domain

GCDS ile ayarlanmış kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin.

Hesapları EKL'lere dahil etme fs.supportedAccounts=account-1[, account-2,...]

Yerleşik hesaplar olup olmadıklarına bakılmaksızın, ACL'lere dahil edilecek hesapların virgülle ayrılmış listesi.

Varsayılan değer BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users'dır.

Yerleşik hesapları ACL'lerden hariç tutma fs.builtinGroupPrefix=prefix

Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur.

Varsayılan değer BUILTIN\\'dır.

Gizli dosya ve klasörlerin dizine eklenmesine izin verme fs.crawlHiddenFiles=boolean

Gizli dosyaları taramak için true olarak ayarlayın. Varsayılan değer: false.

Taranan klasör listelerinin ve DFS ad alanı numaralandırmalarının dizine eklenmesine izin verin fs.indexFolders=boolean

true (varsayılan) olarak ayarlandığında bağlayıcı bir klasörü tararken CONTAINER_ITEM nesnesi oluşturur. Yanlış olarak ayarlandığında bağlayıcı bunun yerine bir VIRTUAL_CONTAINER_ITEM nesnesi oluşturur.

Dosya sistemi değişikliği izlemeyi etkinleştirme fs.monitorForUpdates=boolean

true (varsayılan) olarak ayarlandığında bağlayıcı, içerik veya erişim denetimlerinde yapılan değişiklikler üzerine otomatik olarak yeniden tarama yapar. Bu ayarı false olarak ayarlamak kaynak kullanımını azaltır ancak değişikliklerin arama sonuçlarına yansıtılma hızını düşürür.

Dizin önbelleğinin maksimum boyutunu ayarlama fs.directoryCacheSize=number-of-entries

Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosyaların ve klasörlerin dizine eklenmesini önlemek için gizli klasörleri tanımlamak üzere önbelleği kullanır.

Varsayılan değer 50.000 giriş olup genellikle 10-15 megabayt RAM tüketir.

Zaman damgasını koruma

Bağlayıcının zaman damgası korumasını nasıl ele alacağını belirtmek için bu parametreleri kullanın.

Ayar Parametre
Erişim zamanını koruma fs.preserveLastAccessTime=value

Bağlayıcı, dosyaları ve klasörleri tararken son erişim zaman damgasını tarama zamanına değiştirebilir. Son erişim zamanları korunmazsa yedekleme ve arşiv sistemleri, bağlayıcı tarafından erişildiği için uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir.

Varsayılan olarak fs.preserveLastAccessTime, ALWAYS olarak ayarlanır. Bu, bağlayıcının son erişim zamanını korumaya çalıştığı anlamına gelir. Bağlayıcıyı çalıştıran kullanıcı hesabında dosya özelliklerini yazma ayrıcalıkları yoksa bağlayıcı, son erişim zamanını geri yükleyemez. ALWAYS olarak ayarlanırsa ve bağlayıcı son erişim zamanını koruyamazsa dosya zaman damgalarını değiştirmemek için dosya sistemiyle ilgili tarama isteklerini reddeder.

Olası değerler şunlardır:

  • ALWAYS: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Son erişim zamanını koruyamıyorsa zaman damgalarının değiştirilmesini önlemek için dosya sistemiyle ilgili sonraki tüm tarama isteklerini reddeder.
  • IF_ALLOWED: Bağlayıcı, dosyaları ve klasörleri tararken son erişim zamanını korumaya çalışır. Bazı zaman damgaları korunmamış olsa bile taramaya devam eder.
  • NEVER: Bağlayıcı, son erişim zamanını korumaya çalışmaz.
Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama fs.lastAccessedDate=YYYY-MM-DD

İçeriği yalnızca son erişim zamanı belirtilen tarihten sonra ise tarayın (YYYY-AA-GG, ISO8601 biçimi). Varsayılan değer disabled'dir. Örneğin, 2010-01-01 2010'un başından sonra erişilen içerikleri tarar. fs.lastAccessedDays ile kullanılamaz.

Yalnızca son günlerde erişilen dosyaları tarayın fs.lastAccessedDays=number-of-days

İçeriği yalnızca son erişim zamanı, belirtilen gün sayısı içinde ise tara. Varsayılan değer: disabled. Eski içeriklerin süresinin dolması için kullanışlıdır. Örneğin: 365, geçen yıl erişilen içerikleri tarar. fs.lastAccessedDate ile kullanılamaz.

Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama fs.lastModifiedDate=YYYY-MM-DD

İçeriği yalnızca son değiştirilme zamanı belirtilen tarihten sonra ise tarayın (YYYY-AA-GG, ISO8601 biçimi). Varsayılan değer disabled'dir. Örneğin, 2010-01-01, 2010'un başından sonra değiştirilen içerikleri tarar. fs.lastModifiedDays ile kullanılamaz.

Yalnızca son günlerde değiştirilen dosyaları tarayın fs.lastModifiedDays=number-of-days

İçeriği yalnızca son değiştirilme zamanı, şu andan itibaren belirtilen gün sayısı içindeyse tarayın. Varsayılan değer: disabled. Eski içeriğin süresinin dolması (ör. 365, son bir yılda değiştirilen içerikleri tarar. fs.lastModifiedDate ile kullanılamaz.

Dosya paylaşımı EKL'lerini atlama

Bağlayıcıyı, paylaşım ACL'lerini okuma izni yoksa bunları yoksayacak şekilde ayarlayabilirsiniz. İçerik daha sonra izin verici bir paylaşım ACL'siyle döndürülür.

Ayar Parametre
Paylaşım EKL'lerini atlama fs.skipShareAccessControl=boolean

Paylaşım EKL'lerini yoksaymak için true olarak ayarlayın. Varsayılan değer: false.