Google Cloud Search'ü, Google Workspace içeriğinize ek olarak kuruluşunuzun Microsoft Windows paylaşımlarından da sonuç döndürecek şekilde ayarlayabilirsiniz. Google Cloud Search Dosya Sistemleri bağlayıcısını kullanıyor ve belirli Windows paylaşımlarına erişecek şekilde yapılandırıyorsunuz. Tek bir bağlayıcı örneği birden fazla Microsoft Windows paylaşımını destekleyebilir.
Dikkat edilecek önemli noktalar
Sürekli otomatik güncellemeler
Varsayılan olarak bağlayıcı, başlatıldığında başlangıç yollarını (bağlayıcı yapılandırma dosyasındaki fs.src
değerleri) sürekli olarak izler. Dosya sistemi, içerikte veya erişim kontrollerinde değişiklik olduğunu bildirdiğinde bağlayıcı, dosya sistemini yeniden taramak için tetiklenir. Bu yeniden tarama, kaynakların yoğun bir şekilde kullanılmasına yol açabilir. Dosya sistemi izlemeyi devre dışı bırakmak için fs.monitorForUpdates
seçeneğini false
olarak ayarlayın. Konnektörün kaynak kullanımını önemli ölçüde azaltırsınız ancak konnektörün değişiklikleri yansıtması gecikir. Daha fazla bilgi
DFS erişim denetimi
DFS sistemi, bağlantılarında erişim kontrolü uygular ve genellikle her DFS bağlantısının kendi ACL'si vardır. DFS'nin kullandığı mekanizmalardan biri, bir kullanıcıya döndürülen DFS bağlantılarını kısıtlayabilen erişime dayalı numaralandırmadır (ABE). ABE, barındırılan ana dizinleri yalıttığında kullanıcılar yalnızca DFS bağlantılarının bir alt kümesini veya hatta yalnızca bir bağlantıyı alabilir. Bağlayıcı bir DFS sistemini geçtiğinde DFS bağlantısı ACL'sine ve hedefin Paylaşım ACL'sine uyar. Paylaşım ACL'si, DFS ACL'sinden devralınır.
Bilinen sınırlamalar
- Dosya Sistemi: Dosya Sistemleri bağlayıcısı, eşlenmiş sürücüleri ve yerel sürücüleri desteklemez.
- Dağıtılmış Dosya Sistemi: UNC DFS'ye eşlenmiş bir sürücü düzgün çalışmıyor. Bazı erişim kontrol listeleri doğru şekilde okunmuyor.
- Dosya Sistemleri bağlayıcısı, Dağıtılmış Dosya Sistemi (DFS) ad alanlarını ve bağlantılarını destekler. Ancak bağlayıcı, DFS bağlantılarını yalnızca DFS ad alanında destekler. DFS ad alanındaki normal klasörlerde desteklemez.
- cloudsearch.google.com'da döndürülen dosya bağlantıları tıklanamıyor. Query API tarafından döndürülen dosya bağlantıları da çoğu tarayıcıda tıklanamaz.
Sistem gereksinimleri
Sistem gereksinimleri | |
---|---|
İşletim sistemi |
|
Yazılım |
|
Dosya sistemi protokolleri |
Desteklenmez: Yerel Windows dosya sistemleri, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 veya yerel Linux dosya sistemi. |
Bağlayıcıyı dağıtma
Ön koşullar
Cloud Search Dosya Sistemleri bağlayıcısını dağıtmadan önce ortamınızda aşağıdaki ön koşul bileşenlerinin bulunduğundan emin olun:
Google Cloud Search ile veri kaynağı arasında ilişki oluşturmak için gereken Google Workspace bilgileri:
- Google Workspace özel anahtarı (hizmet hesabı kimliğini içerir). Özel anahtar edinme hakkında bilgi için Google Cloud Search REST API'ye erişimi yapılandırma başlıklı makaleyi inceleyin.
- Google Workspace veri kaynağı kimliği. Veri kaynağı kimliği edinme hakkında bilgi için Aramaya veri kaynağı ekleme başlıklı makaleyi inceleyin.
- Kimlik kaynağı kimliği. Kimlik kaynağı kimliği edinme hakkında bilgi için Kimlik kaynağı oluşturma başlıklı makaleyi inceleyin. Google Workspace dizininizi Active Directory ile senkronize ediyorsanız kimlik kaynağını GCDS ile ayarlayın.
Kuruluşunuzun Google Workspace yöneticisi genellikle bu kimlik bilgilerini size sağlayabilir.
Windows hesabının yeterli izinlere sahip olduğundan emin olun. Bu konuyla ilgili bilgileri aşağıdaki bölümde bulabilirsiniz.
Gerekli Microsoft Windows hesabı izinleri
Bağlayıcının çalıştığı Microsoft Windows hesabının aşağıdaki işlemleri gerçekleştirmek için yeterli izinlere sahip olması gerekir:
- Klasörlerin içeriğini listeleme
- Belgelerin içeriğini okuma
- Dosya ve klasörlerin özelliklerini okuma
- Hem dosyalar hem de klasörler için okuma izinleri (EKL'ler)
- Temel özellikler için yazma izinleri
Aşağıdaki gruplardan birine üye olmak, bir Windows hesabına bağlayıcı için gereken yeterli izinleri verir:
- Yöneticiler
- Deneyimli Kullanıcılar
- Yazdırma Operatörleri
- Sunucu Operatörleri
1. Adım: Google Cloud Search File Systems bağlayıcısını yükleme
Bağlayıcı deposunu GitHub'dan alın ve oluşturun.
Windows sunucusunda git'i kullanmak için:
Kod deposunu klonlayın:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Bağlayıcının istediğiniz sürümünü kontrol edin:
> git checkout tags/v1-0.0.3
Doğrudan GitHub'dan indirmek için:
- https://github.com/google-cloudsearch/windows-filesystems-connector adresine gidin.
- Klonla veya indir Zip dosyasını indir'i tıklayın.
- Paketi açın.
- Yeni dizine gidin:
> cd windows-filesystems-connector
Bağlayıcıyı oluşturun. Gerekirse Apache Maven'ı yükleyin.
> mvn package
Bağlayıcıyı oluştururken testleri atlamak için
mvn package
yerinemvn package -DskipTests
komutunu çalıştırın.Bağlayıcı ZIP dosyasını yerel yükleme dizininize kopyalayın:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
2. adım: Bağlayıcı yapılandırma dosyasını oluşturma
Bağlayıcı yüklemesiyle aynı dizinde bir dosya oluşturun ve dosyayı
connector-config.properties
olarak adlandırın.Dosya içeriğine aşağıdaki örnekte gösterildiği gibi anahtar/değer çiftleri olarak parametreler ekleyin:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Her parametrenin ayrıntılı açıklaması için yapılandırma parametreleri referansına gidin.
(İsteğe bağlı) Diğer bağlayıcı parametrelerini gerektiği gibi yapılandırın. Ayrıntılar için Google tarafından sağlanan bağlayıcı parametreleri başlıklı makaleyi inceleyin.
3. Adım: Günlük kaydını etkinleştir
- Bağlayıcı ikilisini içeren dizinde
logs
adlı bir klasör oluşturun. Bağlayıcı ikilisini içeren dizinde
logging.properties
adlı bir ASCII veya UTF-8 dosyası oluşturun ve aşağıdaki içeriği ekleyin:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
4. Adım. (İsteğe bağlı) Medya türlerini yapılandırma
Varsayılan olarak bağlayıcı, her dosyanın medya türünü JDK tarafından sağlanan medya türü algılama özelliğiyle tespit etmeye çalışır. Microsoft Windows'da JDK, dosyaların medya türlerini belirlemek için Windows kayıt defterini kullanır. Kayıt defteri girişinin eksik olması, belirli dosyalar için boş bir medya türüyle sonuçlanabilir.
Gerekirse mevcut bağlamaları geçersiz kılan veya boş medya türünü engelleyen bir medya türü belirtebilirsiniz.
- Bağlayıcı dizininde
mime-type.properties
adlı bir Latin-1 şifreli dosya oluşturun. Dosya uzantılarını ve bunlara karşılık gelen medya türlerini aşağıdaki örneklerdeki gibi girin:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
5. adım: Dosya Sistemleri bağlayıcısını çalıştırın
Dosya Sistemleri bağlayıcısını yükleyip yapılandırdıktan sonra, ana makinede başlatmak için aşağıdaki örnekteki gibi bir komut çalıştırın:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Varsayılandan farklıysa (connector-config.properties
adlı ikiliyle aynı dizinde) yapılandırma dosyası yolunu belirtin.
Yapılandırma parametreleri referansı
Veri kaynağı erişimi
Yer | Parametre |
Veri kaynağı kimliği | api.sourceId=1234567890abcdef
Zorunlu. Google Workspace yöneticisi tarafından ayarlanan Google Cloud Search kaynak kimliği. |
Hizmet hesabı özel anahtar dosyasının yolu | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Zorunlu. Google Cloud Search Dosya Sistemleri bağlayıcısının erişilebilirliği için Google Cloud Search hizmet hesabı anahtar dosyası. |
Kimlik kaynağı kimliği | api.identitySourceId=x0987654321
Zorunlu. Google Workspace yöneticisi tarafından GCDS kullanılarak Active Directory kimliklerinin senkronize edilmesi için ayarlanan Cloud Search kimlik kaynağı kimliği. |
Dosya sistemi erişimi
Yer | Parametre |
Kaynak dosya sistemleri | fs.src=path1[,path2, ...]
Zorunlu. Kaynak dosya sistemlerini, |
Yol ayırıcı karakter
Yer | Parametre |
Yol ayırıcı karakter | fs.src.separator=separator-character
Varsayılan ayırıcı ";" şeklindedir. Kaynak yollarınız noktalı virgül içeriyorsa yollarınızdaki karakterlerle çakışmayan ve özellik dosyası söz dizimi tarafından ayrılmamış farklı bir sınırlayıcı (ör. virgül ",") ayarlayabilirsiniz.
|
Bağlayıcı davranışı
Yer | Parametre |
Windows alanı | fs.supportedDomain=domain
GCDS ile ayarlanmış kullanıcıların Cloud Search üzerinden dokümanlara erişmesine izin vermek için gereklidir. Active Directory'nin tek bir NetBIOS alan adı olarak belirtin. |
Hesapları EKL'lere dahil etme | fs.supportedAccounts=account-1[, account-2,...]
Yerleşik hesaplar olup olmadıklarına bakılmaksızın, ACL'lere dahil edilecek hesapların virgülle ayrılmış listesi. Varsayılan değer |
Yerleşik hesapları erişim kontrol listelerinden hariç tutma | fs.builtinGroupPrefix=prefix
Yerleşik hesapların önekini belirtin. Bu önekle başlayan bir hesap, yerleşik hesap olarak kabul edilir ve EKL'lerden hariç tutulur. Varsayılan değer |
Gizli dosya ve klasörlerin dizine eklenmesine izin ver | fs.crawlHiddenFiles=boolean
Bağlayıcının gizli dosya ve klasörleri taramasına izin vermek için |
Taranan klasör listelerinin ve DFS ad alanı numaralandırmalarının dizine eklenmesine izin verin | fs.indexFolders=boolean
|
Dosya sistemi değişikliği izlemeyi etkinleştirme | fs.monitorForUpdates=boolean
|
Dizin önbelleğinin maksimum boyutunu ayarlama | fs.directoryCacheSize=number-of-entries
Dizin önbelleğinin maksimum boyutu. Bağlayıcı, gizli klasörlerdeki dosyaların ve klasörlerin dizine eklenmesini önlemek için gizli klasörleri tanımlamak üzere önbelleği kullanır. Varsayılan değer 50.000 giriştir ve bu genellikle 10-15 megabayt RAM tüketir. |
Zaman damgasını koruma ve tarama kontrolü
Yer | Parametre |
Son erişim zaman damgasını koru | fs.preserveLastAccessTime=value
Bağlayıcı, dosya ve klasörleri taradığında bunların son erişim zaman damgasını tarama zamanına değiştirebilir. Son erişim zamanları korunmadığında, yedekleme ve arşiv sistemleri, bağlayıcının ziyareti nedeniyle uygun dosya ve klasörleri ikincil depolama alanına taşımayabilir. Bağlayıcı, varsayılan olarak son erişim zamanını korumaya çalışır ( Olası değerler:
|
Yalnızca belirli bir tarihten sonra erişilen dosyaları tarama | fs.lastAccessedDate=YYYY-MM-DD
İçeriği yalnızca son erişim zamanı belirtilen tarihten sonra ise tarayın. Varsayılan değer: Tarihi ISO8601 tarih biçiminde (YYYY-AA-GG) belirtin. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra erişilen içerikleri tarar.
|
Yalnızca son günlerde erişilen dosyaları tarayın | fs.lastAccessedDays=number-of-days
İçeriği yalnızca son erişim zamanı, şu anki tarihten önceki gün sayısı içindeyse tarayın. Varsayılan değer: Bir süredir erişilmeyen, daha önce dizine eklenmiş içeriklerin süresini sona erdirmek için bu özelliği kullanın. Örneğin, içeriğin yalnızca son bir yıl içinde erişilmişse taranması için 365 olarak ayarlayın.
|
Yalnızca belirli bir tarihten sonra değiştirilen dosyaları tarama | fs.lastModifiedDate=YYYY-MM-DD
İçeriği yalnızca son değiştirilme zamanı belirtilen tarihten sonra ise tarayın. Varsayılan değer: Tarihi ISO8601 tarih biçiminde (YYYY-AA-GG) belirtin. Örneğin, değer 2010-01-01 ise bağlayıcı yalnızca 2010'un başından sonra değiştirilen içerikleri tarar.
|
Yalnızca son günlerde değiştirilen dosyaları tarayın | fs.lastModifiedDays=number-of-days
İçeriği yalnızca son değiştirme zamanı, şu anki tarihten önceki gün sayısı içindeyse tarayın. Varsayılan değer: Bir süredir değiştirilmeyen, daha önce dizine eklenmiş içeriklerin süresini sona erdirmek için bu özelliği kullanın. Örneğin, içeriğin yalnızca son bir yıl içinde değiştirilmesi durumunda taranması için 365 olarak ayarlayın.
|
Dosya paylaşımı erişim denetimini atlama
Bağlayıcı, dosya paylaşımındaki EKL'ler de dahil olmak üzere erişim kontrol listelerini (EKL'ler) dizine ekleme API'sine gönderirken varsayılan olarak erişim kontrolü bütünlüğünü korur. Ancak bazı yapılandırmalarda bağlayıcı, paylaşım ACL'sini okumak için yeterli izne sahip olmayabilir. Bu durumlarda bağlayıcı, arama sonuçlarında söz konusu dosya paylaşımında tutulan dosyaları döndürmez.
İçeriğin her zaman arama sonuçlarında döndürülmesi için bağlayıcıyı paylaşım EKL'sini yoksayacak şekilde ayarlayabilirsiniz. Bu durumda, Indexing API, gerçek paylaşım EKL'si yerine tamamen izin verici bir paylaşım EKL'si alır.
Yer | Parametre |
Dosya paylaşımı erişim denetimini atlama | fs.skipShareAccessControl=boolean
Paylaşım EKL'lerini zorunlu kılmak için |