Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanıp belirtilen Windows paylaşımlarına erişmek için bu bağlayıcıyı yapılandırırsınız. Tek bir bağlayıcı örneği, birden fazla Microsoft Windows paylaşımını destekleyebilir.
Dikkat edilmesi gerekenler
Sürekli otomatik güncellemeler
Varsayılan olarak, bağlayıcı başlatıldığında başlangıç yollarını (bağlayıcı yapılandırması dosyasındaki fs.src
değerleri) sürekli olarak izler. Dosya sistemi, içerik veya erişim denetimlerinde değişiklik yaptığında, bağlayıcı, dosya sistemini yeniden taramak üzere tetiklenir. Bu yeniden tarama, kaynak yoğun olabilir. Dosya sistemi izlemeyi kapatmak için fs.monitorForUpdates
değerini false
olarak ayarlayın. Bağlayıcının kaynak kullanımını önemli ölçüde azaltırsınız ancak bağlayıcı değişiklikleri yansıttığında gecikme oluşur. Daha fazla bilgi
DFS erişim denetimi
DFS sistemi, bağlantılara erişim denetimini uygular ve genellikle her DFS bağlantısının kendi EKL'si vardır. DFS'nin kullandığı mekanizmalardan biri, bir kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilecek Erişim Tabanlı Sıralama'dır (ABE). Kullanıcılar, yalnızca DFS Bağlantılarının bir alt kümesini veya ABE tarafından barındırılan ana dizinleri izole ettiğinde bir bağlantı alabilir. Bağlayıcı bir DFS sisteminden geçtiğinde, bağlayıcı DFS bağlantı EKL'sine ve hedefin Paylaşım EKL'sine uyar ve Paylaşım EKL'si DFS EKL'den devralır.
Bilinen sınırlamalar
- Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenmiş sürücüleri ve yerel sürücüleri desteklemez.
- Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü doğru çalışmıyor. Bazı EKL'ler doğru şekilde okunmuyor.
- Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantıları destekler. Bununla birlikte, bağlayıcı yalnızca DFS ad alanındaki DFS bağlantılarını destekler, DFS ad alanındaki normal klasörleri desteklemez.
- cloudsearch.google.com'da döndürülen dosya bağlantıları tıklanabilir değildir. Query API tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanabilir değildir.
Sistem gereksinimleri
Sistem gereksinimleri | |
---|---|
İşletim sistemi |
|
Yazılım |
|
Dosya sistemi protokolleri |
Desteklenmiyor: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya Yerel Linux dosya sistemi. |
Bağlayıcıyı dağıtma
Ön koşullar
Cloud Search File Systems bağlayıcısını dağıtmadan önce ortamınızın aşağıdaki ön koşul bileşenlerinin tümüne sahip olduğundan emin olun:
Google Cloud Search ile veri kaynağı arasında ilişki kurmak için gereken Google Workspace bilgileri:
- Google Workspace özel anahtarı (hizmet hesabı kimliğini içerir). Özel anahtar edinme hakkında bilgi edinmek için Google Cloud Search REST API erişimini yapılandırma sayfasına gidin.
- Google Workspace veri kaynağı kimliği. Veri kaynağı kimliği alma hakkında bilgi edinmek için Aramaya veri kaynağı ekleme sayfasına gidin.
- Bir kimlik kaynağı kimliği. Kimlik kaynağı kimliği alma hakkında bilgi edinmek için Kimlik kaynağı oluşturma bölümüne gidin. Google Workspace dizininizi Active Directory ile senkronize ediyorsanız kimlik kaynağını GCDS ile ayarlayın.
Kuruluşunuzun Google Workspace yöneticisi genellikle bu kimlik bilgilerini alabilir.
Windows hesabının aşağıdaki bölümde açıklandığı gibi yeterli izinlere sahip olduğundan emin olun.
Gerekli Microsoft Windows hesap izinleri
Bağlayıcının çalıştırıldığı Microsoft Windows hesabı, aşağıdaki işlemleri gerçekleştirmek için yeterli izne sahip olmalıdır:
- Klasörlerin içeriğini listeleme
- Belgelerin içeriğini okuma
- Dosya ve klasörlerin özelliklerini okuma
- Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
- Temel özellik izinlerini yazma
Aşağıdaki gruplardan birine üye olmak, bir Windows hesabına bağlayıcının ihtiyaç duyduğu yeterli izinleri sağlar:
- Yöneticiler
- Deneyimli Kullanıcılar
- Baskı Operatörleri
- Sunucu Operatörleri
1. Adım: Cloud Search File Systems bağlayıcısını yükleme
Bağlayıcı deposunu GitHub'dan alın ve oluşturun.
Windows sunucusunda git kullanmak için:
Kod deposunu klonlayın:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Bağlayıcının istediğiniz sürümüne göz atın:
> git checkout tags/v1-0.0.3
Doğrudan GitHub'dan indirmek için:
- https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
- Klonla veya indir Zip dosyasını indir'i tıklayın.
- Sıkıştırılmış paketi açın.
- Yeni dizine gidin:
> cd windows-filesystems-connector
Bağlayıcıyı oluşturun. Gerekirse Apache Maven'ı yükleyin.
> mvn package
Bağlayıcıyı oluştururken testleri atlamak için
mvn package
yerinemvn package -DskipTests
komutunu çalıştırın.Bağlayıcı zip dosyasını yerel yükleme dizininize kopyalayın:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
2. Adım. Bağlayıcı yapılandırma dosyası oluşturma
Bağlayıcı kurulumuyla aynı dizinde bir dosya oluşturun ve bu dosyaya
connector-config.properties
adını verin.Parametreleri aşağıdaki örnekte olduğu gibi dosya içeriğine anahtar/değer çifti olarak ekleyin:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Her parametrenin ayrıntılı açıklamaları için yapılandırma parametreleri referansına gidin.
(İsteğe bağlı) Gerektiğinde diğer bağlayıcı parametrelerini yapılandırın. Ayrıntılar için Google tarafından sağlanan bağlayıcı parametreleri bölümüne bakın.
3. Adım. Günlük kaydını etkinleştir
- Bağlayıcı ikili programını içeren dizinde
logs
adlı bir klasör oluşturun. Bağlayıcı ikili programını içeren dizinde
logging.properties
adında bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma
Bağlayıcı, varsayılan olarak her bir dosyanın medya türünü JDK tarafından sağlanan medya türü algılama teknolojisiyle algılamaya çalışır. Microsoft Windows'da JDK, dosyalar için medya türlerini belirlemek amacıyla Windows kayıt defterine güvenir. Eksik kayıt defteri girişi, belirli dosyalar için boş değerli medya türüyle sonuçlanabilir.
Gerekirse mevcut bağlamaların üzerine yazan veya boş bir medya türünü önleyen bir medya türü belirtebilirsiniz.
- Bağlayıcı dizininde
mime-type.properties
adlı bir Latin-1 şifreli dosya oluşturun. Aşağıdaki örneklerde gösterildiği gibi dosya uzantılarını ve karşılık gelen medya türlerini girin:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
5. Adım: Dosya Sistemleri bağlayıcısını çalıştırın
Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra ana makinede başlatmak için aşağıdaki örneğe benzer bir komut çalıştırın:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Varsayılandan farklı ise yapılandırma dosyası yolunu belirtin (connector-config.properties
adlı ikili programla aynı dizin).
Yapılandırma parametreleri referansı
Veri kaynağı erişimi
Tema | Parametre |
Veri kaynağı kimliği | api.sourceId=1234567890abcdef
Zorunlu. Google Workspace yöneticisi tarafından oluşturulan Google Cloud Search kaynak kimliği. |
Hizmet hesabı özel anahtar dosyasının yolu | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcısı erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası. |
Kimlik kaynağı kimliği | api.identitySourceId=x0987654321
Zorunlu. Etkin dizin kimliklerini GCDS ile senkronize etmek için Google Workspace yöneticisi tarafından oluşturulan Cloud Search kimlik kaynağı kimliği. |
Dosya sistemi erişimi
Tema | Parametre |
Kaynak dosya sistemleri | fs.src=path1[,path2, ...]
Zorunlu. Kaynak dosya sistemlerini, |
Yol ayırıcı karakter
Tema | Parametre |
Yol ayırıcı karakter | fs.src.separator=separator-character
Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmayan virgül (",") gibi farklı bir sınır ayarlayabilirsiniz.
|
Bağlayıcı davranışı
Tema | Parametre |
Windows alanı | fs.supportedDomain=domain
GCDS ile oluşturulan kullanıcıların dokümanlara Cloud Search üzerinden erişmesine izin verilmesi gerekir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin. |
EKL'lerdeki hesapları dahil et | fs.supportedAccounts=account-1[, account-2,...]
EKL'lere eklenecek hesapların virgülle ayrılmış listesi (yerleşik hesaplar olup olmamasına bakılmaksızın). Varsayılan değer |
Yerleşik hesapları EKL'lerden hariç tutma | fs.builtinGroupPrefix=prefix
Yerleşik hesapların ön ekini belirtin. Bu ön ekle başlayan bir hesap, yerleşik bir hesap olarak kabul edilir ve EKL'lerden hariç tutulur. Varsayılan değer |
Gizli dosyaların ve klasörlerin dizine eklenmesine izin verme | fs.crawlHiddenFiles=boolean
Bağlayıcının gizli dosyaları ve klasörleri taramasına izin vermek için |
Taranan klasör girişlerinin ve DFS Ad Alanı sıralamalarının dizine eklenmesine izin ver | fs.indexFolders=boolean
|
Dosya sistemi değişikliği izlemeyi etkinleştir | fs.monitorForUpdates=boolean
|
Dizin önbelleğinin maksimum boyutunu ayarlama | fs.directoryCacheSize=number-of-entries
Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörleri tanımlamak için bu önbelleği kullanır. Varsayılan değer 50.000 giriştir. Bu girişler genellikle 10-15 megabayt RAM kullanır. |
Zaman damgası koruması ve tarama kontrolü
Tema | Parametre |
Son erişim zaman damgasını koru | fs.preserveLastAccessTime=value
Bağlayıcı, dosya ve klasörleri taradığında, dosyaların ve klasörlerin son erişim zaman damgasını tarama sırasında değiştirebilir. Son erişim süreleri korunmadığında, yedekleme ve arşivleme sistemleri, bağlayıcının ziyaretinden dolayı uygun dosyaları ve klasörleri ikincil depolama alanına taşımayabilir. Varsayılan olarak, bağlayıcı son erişim zamanını korumaya çalışır ( Olası değerler:
|
Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama | fs.lastAccessedDate=YYYY-MM-DD
Yalnızca son erişim zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer Tarihi, ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra erişilen içeriği tarar.
|
Yalnızca son birkaç gün içinde erişilen dosyalar | fs.lastAccessedDays=number-of-days
Yalnızca son erişim zamanı, mevcut günlerden önce olan gün sayısı içindeyse içeriği tarar. Varsayılan değer Bir süredir erişilmemiş, önceden dizine eklenen içeriğin süresini sona erdirmek için bu özelliği kullanın. Örneğin, yalnızca geçen yıl erişildiğinde içeriği taramak için 365 olarak ayarlayın.
|
Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama | fs.lastModifiedDate=YYYY-MM-DD
Yalnızca son değiştirme zamanı belirtilen tarihten sonraysa içeriği tarayın. Varsayılan değer Tarihi, ISO8601 tarih biçiminde belirtin: YYYY-AA-GG. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başlangıcından sonra değiştirilen içeriği tarar.
|
Yalnızca son birkaç gün içinde değiştirilmiş dosyaları tara | fs.lastModifiedDays=number-of-days
Yalnızca son değiştirme zamanı, mevcut gün sayısı dahilindeyse içeriği tarar. Varsayılan değer Bir süre önce değiştirilmemiş, önceden dizine eklenmiş içeriğin geçerliliğini sona erdirmek için bu özelliği kullanın. Örneğin, yalnızca geçen yıl değiştirilmişse içeriği taramak için 365 olarak ayarlayın.
|
Dosya paylaşımı erişim kontrolünü atla
Varsayılan olarak, bağlayıcı, dosya paylaşımındaki EKL'ler dahil olmak üzere, Erişim Kontrol Listelerini (EKL'ler) dizine ekleme API'sine gönderdiğinde erişim kontrolü bütünlüğünü korur. Ancak bazı yapılandırmalarda, bağlayıcı EKL'yi okumak için yeterli izinlere sahip olmayabilir. Böyle durumlarda bağlayıcı, arama sonuçlarında söz konusu dosya paylaşımında saklanan dosyaları döndürmez.
Bağlayıcıyı, paylaşım EKL'sini yok sayacak şekilde ayarlayabilirsiniz, böylece içerik her zaman arama sonuçlarında döndürülür. Bu durumda, dizine ekleme API'si, gerçek paylaşım EKL'si yerine tamamen serbest bir paylaşım EKL'si alır.
Tema | Parametre |
Dosya paylaşımı erişim kontrolünü atla | fs.skipShareAccessControl=boolean
Paylaşım EKL'lerini zorunlu kılmak için |