Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından da sonuç döndürecek şekilde ayarlayabilirsiniz. Cloud Search File Systems bağlayıcısını kullanır ve belirli Windows paylaşımlarına erişmek için bağlayıcıyı yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.
Dikkat edilecek önemli noktalar
Dosya Sistemleri bağlayıcısını dağıtmadan önce aşağıdaki noktaları gözden geçirin.
Sürekli otomatik güncellemeler
Bağlayıcı, varsayılan olarak başlatıldığında başlangıç yollarını (yapılandırma dosyasındaki fs.src değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde değişiklik olduğunu bildirdiğinde bağlayıcı, dosya sistemini yeniden tarar. Bu yeniden tarama, kaynak açısından yoğun olabilir. İzlemeyi devre dışı bırakmak için fs.monitorForUpdates değerini false olarak ayarlayın. Bu, kaynak kullanımını azaltır ancak bağlayıcının değişiklikleri yansıtmasını geciktirir. Daha fazla bilgi
DFS erişim denetimi
DFS sistemi, bağlantılarında erişim kontrolü uygular ve genellikle her DFS bağlantısının kendi ACL'si vardır. DFS, bir kullanıcıya döndürülen bağlantıları kısıtlamak için erişime dayalı numaralandırma (ABE) kullanır. ABE, ana dizinleri yalıttığında kullanıcılar DFS bağlantılarının yalnızca bir alt kümesini veya yalnızca bir bağlantıyı görebilir. DFS sisteminde gezinirken bağlayıcı, DFS bağlantı EKL'sine ve hedefin paylaşım EKL'sine uyar. Paylaşım EKL'si, DFS EKL'sinden devralınır.
Bilinen sınırlamalar
Bu bölümde, dosya sistemi bağlayıcısının bilinen sınırlamaları listelenmektedir.
- Dosya sistemi: Bağlayıcı, eşlenmiş veya yerel sürücüleri desteklemez.
- Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü doğru çalışmıyor ve bazı ACL'ler doğru şekilde okunmuyor.
- Bağlayıcı, DFS ad alanındaki normal klasörleri değil, DFS ad alanlarını ve bağlantılarını destekler.
cloudsearch.google.comiçindeki veya Query API tarafından döndürülen dosya bağlantıları çoğu tarayıcıda tıklanamaz.
Sistem gereksinimleri
Dosya Sistemleri bağlayıcısını dağıtmadan önce, ana makinenin aşağıdaki koşulları karşıladığından emin olun:
| Sistem gereksinimleri | |
|---|---|
| İşletim sistemi |
|
| Yazılım |
|
| Dosya sistemi protokolleri |
Desteklenmez: Yerel Windows dosya sistemleri, NFS 2.0, NFS 3.0 veya yerel Linux dosya sistemleri. |
Bağlayıcıyı dağıtma
Dosya Sistemleri bağlayıcısını dağıtmak için aşağıdaki adımları uygulayın.
Ön koşullar
Bağlayıcıyı dağıtmadan önce ortamınızda aşağıdaki bileşenlerin bulunduğundan emin olun:
Bağlantı oluşturmak için Google Workspace bilgileri:
- Google Workspace özel anahtarı (hizmet hesabı kimliğini içerir). Cloud Search API'ye erişimi yapılandırma başlıklı makaleyi inceleyin.
- Google Workspace veri kaynağı kimliği. Aramaya veri kaynağı ekleme başlıklı makaleyi inceleyin.
- Kimlik kaynağı kimliği. Kimlik kaynağı oluşturma başlıklı makaleyi inceleyin. Active Directory ile senkronize ediyorsanız GCDS'yi kullanın.
Bu kimlik bilgilerini genellikle Google Workspace yöneticiniz sağlayabilir.
Windows hesabının yeterli izinlere sahip olduğundan emin olun.
Gerekli Microsoft Windows hesabı izinleri
Bağlayıcıyı çalıştıran Windows hesabının şu izinlere sahip olması gerekir:
- Klasör içeriğini listeleme
- Belge içeriğini okuma
- Dosya ve klasör özelliklerini okuma.
- Dosya ve klasörler için okuma izinleri (EKL'ler).
- Temel özellikleri yazma.
Bu gruplardan birine üye olmak genellikle yeterli izinleri verir: Yöneticiler, Güçlü Kullanıcılar, Yazdırma Operatörleri veya Sunucu Operatörleri.
1. Adım: Bağlayıcıyı yükleme
Bağlayıcı deposunu GitHub'dan indirin veya kopyalayın, ardından bağlayıcı paketini oluşturun.
Bağlayıcı deposunu GitHub'dan alın ve oluşturun.
Windows sunucusunda git'i kullanmak için:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
Doğrudan indirmek için:
- windows-filesystems-connector adresine gidin.
- Klonla veya indir > Zip olarak indir'i tıklayın.
- Paketin zip dosyasını açın ve dizine gidin.
Apache Maven kullanarak bağlayıcıyı oluşturun:
Testleri atlamak için> mvn package
mvn package -DskipTestssimgesini kullanın.Bağlayıcı ZIP dosyasını kurulum dizininize çıkarın:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
2. adım: Yapılandırma dosyasını oluşturma
Bağlayıcıyı yükledikten sonra, bağlayıcı ayarlarını içeren bir yapılandırma dosyası oluşturun.
- Bağlayıcı dizininde adlı bir dosya oluşturun.
connector-config.properties Parametreleri anahtar/değer çiftleri olarak ekleyin. Örneğin:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDDosya sistemine özgü parametreler için Yapılandırma parametreleri referansı'na bakın. Tüm Cloud Search bağlayıcıları tarafından kullanılan ortak parametrelerin listesi için Google tarafından sağlanan bağlayıcı parametreleri başlıklı makaleyi inceleyin.
3. Adım: Günlük kaydını etkinleştir
Günlükler için bir dizin ve günlük kaydı yapılandırma dosyası oluşturun.
- Bağlayıcı dizininde
logsadlı bir klasör oluşturun. logging.propertiesadlı bir dosya oluşturun ve şu içeriği ekleyin:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma
Bağlayıcı, Windows'da kayıt defteri girişlerine dayanan varsayılan mekanizmasını kullanarak dosya medya türlerini algılamaya çalışır. Bir dosya uzantısı için kayıt defteri girişi eksikse bağlayıcı, medya türünü doğru şekilde algılayamayabilir. Medya türleri doğru şekilde algılanmıyorsa veya bir uzantının varsayılan türünü geçersiz kılmak istiyorsanız aşağıdaki adımları uygulayın:
- Bağlayıcı dizininde
mime-type.propertiesadlı bir dosya oluşturun. - Uzantıları ve türleri
extension=media/typeolarak girin:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
5. Adım: Dosya sistemleri bağlayıcısını çalıştırma
Bağlayıcıyı ana makineden başlatın:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]Bağlayıcı, varsayılan olarak bağlayıcının çalıştırıldığı dizinde connector-config.properties adlı bir yapılandırma dosyası arar.
Yapılandırma dosyanızın adı farklıysa veya başka bir dizindeyse,
yolunu belirtmek için -Dconfig parametresini kullanın.
Yapılandırma parametreleri referansı
Aşağıdaki tablolarda, Dosya Sistemleri bağlayıcısını yapılandırmak için kullanılan parametreler listelenmekte ve açıklanmaktadır.
Veri kaynağı erişimi
| Ayar | Parametre |
| Veri kaynağı kimliği | api.sourceId=1234567890abcdef
Zorunlu. Cloud Search kaynak kimliği. |
| Hizmet hesabı | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Zorunlu. Hizmet hesabı anahtar dosyasının yolu. |
| Kimlik kaynağı kimliği | api.identitySourceId=x0987654321
Zorunlu. Google Workspace yöneticisi tarafından GCDS kullanılarak Active Directory kimliklerinin senkronize edilmesi için ayarlanan Cloud Search kimlik kaynağı kimliği. |
Dosya sistemi erişimi
Tarama yapılacak dosya sistemi kaynaklarını belirtmek için bu parametreleri kullanın.
| Ayar | Parametre |
| Kaynak dosya sistemleri | fs.src=path1[,path2, ...]
Zorunlu. Kaynak dosya sistemlerini, |
Yol ayırıcı karakter
| Ayar | Parametre |
| Yol ayırıcı karakter | fs.src.separator=separator-character
Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmamış farklı bir sınırlayıcı (ör. virgül ",") ayarlayabilirsiniz.
|
Bağlayıcı davranışı
Bağlayıcının dosya sistemlerini nasıl tarayacağını ayarlamak için bu parametreleri kullanın.
| Ayar | Parametre |
| Windows alanı | fs.supportedDomain=domain
GCDS ile ayarlanmış kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin. |
| Hesapları EKL'lere dahil etme | fs.supportedAccounts=account-1[, account-2,...]
Yerleşik hesaplar olup olmadıklarına bakılmaksızın, ACL'lere dahil edilecek hesapların virgülle ayrılmış listesi. Varsayılan değer |
| Yerleşik hesapları ACL'lerden hariç tutma | fs.builtinGroupPrefix=prefix
Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur. Varsayılan değer |
| Gizli dosya ve klasörlerin dizine eklenmesine izin verme | fs.crawlHiddenFiles=boolean
Gizli dosyaları taramak için |
| Taranan klasör listelerinin ve DFS ad alanı numaralandırmalarının dizine eklenmesine izin verin | fs.indexFolders=boolean
|
| Dosya sistemi değişikliği izlemeyi etkinleştirme | fs.monitorForUpdates=boolean
|
| Dizin önbelleğinin maksimum boyutunu ayarlama | fs.directoryCacheSize=number-of-entries
Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosyaların ve klasörlerin dizine eklenmesini önlemek için gizli klasörleri tanımlamak üzere önbelleği kullanır. Varsayılan değer 50.000 giriş olup genellikle 10-15 megabayt RAM tüketir. |
Zaman damgasını koruma
Bağlayıcının zaman damgası korumasını nasıl ele alacağını belirtmek için bu parametreleri kullanın.
| Ayar | Parametre |
| Erişim zamanını koruma | fs.preserveLastAccessTime=value
Bağlayıcı, dosyaları ve klasörleri tararken son erişim zaman damgasını tarama zamanına değiştirebilir. Son erişim zamanları korunmazsa yedekleme ve arşiv sistemleri, bağlayıcı tarafından erişildiği için uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir. Varsayılan olarak Olası değerler şunlardır:
|
| Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama | fs.lastAccessedDate=YYYY-MM-DD
İçeriği yalnızca son erişim zamanı belirtilen tarihten sonra ise tarayın
(YYYY-AA-GG, ISO8601 biçimi).
Varsayılan değer |
| Yalnızca son günlerde erişilen dosyaları tarayın | fs.lastAccessedDays=number-of-days
İçeriği yalnızca son erişim zamanı, belirtilen gün sayısı içinde ise tara. Varsayılan değer: |
| Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama | fs.lastModifiedDate=YYYY-MM-DD
İçeriği yalnızca son değiştirilme zamanı belirtilen tarihten sonra ise tarayın
(YYYY-AA-GG, ISO8601 biçimi).
Varsayılan değer |
| Yalnızca son günlerde değiştirilen dosyaları tarayın | fs.lastModifiedDays=number-of-days
İçeriği yalnızca son değiştirilme zamanı, şu andan itibaren belirtilen gün sayısı içindeyse tarayın. Varsayılan değer: |
Dosya paylaşımı EKL'lerini atlama
Bağlayıcıyı, paylaşım ACL'lerini okuma izni yoksa bunları yoksayacak şekilde ayarlayabilirsiniz. İçerik daha sonra izin verici bir paylaşım ACL'siyle döndürülür.
| Ayar | Parametre |
| Paylaşım EKL'lerini atlama | fs.skipShareAccessControl=boolean
Paylaşım EKL'lerini yoksaymak için |