Puoi configurare Google Cloud Search in modo che restituisca risultati dalle condivisioni Microsoft Windows della tua organizzazione oltre ai contenuti di Google Workspace. Utilizzi il connettore Cloud Search File Systems e lo configuri per accedere alle condivisioni Windows specificate. Una singola istanza del connettore può supportare più condivisioni di Microsoft Windows.
Considerazioni importanti
Prima di eseguire il deployment del connettore File Systems, esamina le seguenti considerazioni.
Aggiornamenti automatici continui
Per impostazione predefinita, il connettore monitora continuamente i percorsi di avvio (valori di
fs.src nel file di configurazione) all'avvio. Quando il file system
segnala modifiche ai controlli di accesso o ai contenuti, il connettore esegue nuovamente la scansione del file
system. Questa nuova scansione può richiedere molte risorse. Per disattivare il monitoraggio, imposta
fs.monitorForUpdates su false. In questo modo si riduce l'utilizzo delle risorse, ma si ritarda il momento in cui
il connettore riflette le modifiche. Scopri di più
Controllo dell'accesso DFS
Il sistema DFS applica il controllo dell'accesso ai suoi link e in genere ogni link DFS ha il proprio ACL. DFS utilizza l'enumerazione basata sull'accesso (ABE) per limitare i link restituiti a un utente. Gli utenti potrebbero visualizzare solo un sottoinsieme di link DFS o un solo link quando ABE isola le home directory. Quando attraversa un sistema DFS, il connettore rispetta l'ACL del link DFS e l'ACL di condivisione della destinazione; l'ACL di condivisione eredita dall'ACL DFS.
Limitazioni note
Questa sezione elenca le limitazioni note del connettore del file system.
- File system: il connettore non supporta le unità mappate o locali.
- Distributed File System: un'unità mappata a un UNC DFS non funziona correttamente e alcune ACL potrebbero non essere lette correttamente.
- Il connettore supporta spazi dei nomi e link DFS, ma non le cartelle normali nello spazio dei nomi DFS.
- I link ai file in
cloudsearch.google.como restituiti dall'API Query non sono cliccabili nella maggior parte dei browser.
Requisiti di sistema
Prima di eseguire il deployment del connettore File Systems, assicurati che la macchina host soddisfi i seguenti requisiti:
| Requisiti di sistema | |
|---|---|
| Sistema operativo |
|
| Software |
|
| Protocolli del file system |
Non supportati: file system Windows locali, NFS 2.0, NFS 3.0 o file system Linux locali. |
Esegui il deployment del connettore
Segui questi passaggi per eseguire il deployment del connettore File Systems.
Prerequisiti
Prima di eseguire il deployment del connettore, assicurati che il tuo ambiente disponga di questi componenti:
Informazioni su Google Workspace per stabilire le connessioni:
- Chiave privata di Google Workspace (contenente l'ID dell'account di servizio). Consulta Configurare l'accesso all'API Cloud Search.
- ID origine dati di Google Workspace. Vedi Aggiungere un'origine dati per la ricerca.
- Un ID origine identità. Vedi Creare un'origine identità. Se esegui la sincronizzazione con Active Directory, utilizza GCDS.
In genere, l'amministratore di Google Workspace può fornire queste credenziali.
Assicurati che l'account Windows disponga delle autorizzazioni necessarie.
Autorizzazioni account Microsoft Windows richieste
L'account Windows che esegue il connettore deve disporre delle autorizzazioni per:
- Elenca i contenuti della cartella.
- Leggi i contenuti del documento.
- Leggere gli attributi di file e cartelle.
- Autorizzazioni di lettura (ACL) per file e cartelle.
- Scrivere gli attributi di base.
L'appartenenza a uno di questi gruppi in genere concede autorizzazioni sufficienti: amministratori, utenti avanzati, operatori di stampa o operatori del server.
Passaggio 1: Installa il connettore
Scarica o clona il repository del connettore da GitHub, quindi crea il pacchetto del connettore.
Recupera il repository del connettore da GitHub e crealo.
Per utilizzare git sul server Windows:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
Per scaricare direttamente:
- Vai a windows-filesystems-connector.
- Fai clic su Clona o scarica > Scarica zip.
- Decomprimi il pacchetto e spostati nella directory.
Crea il connettore utilizzando Apache Maven:
Per saltare i test, utilizza> mvn package
mvn package -DskipTests.Estrai il file ZIP del connettore nella directory di installazione:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Passaggio 2: Crea il file di configurazione
Dopo aver installato il connettore, crea un file di configurazione che contenga le impostazioni del connettore.
- Nella directory del connettore, crea un file denominato
connector-config.properties. Aggiungi i parametri come coppie chiave-valore. Ad esempio:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDConsulta il riferimento ai parametri di configurazione per i parametri specifici del file system. Per un elenco dei parametri comuni utilizzati da tutti i connettori Cloud Search, consulta Parametri del connettore forniti da Google.
Passaggio 3: Abilita il logging
Crea una directory per i log e un file di configurazione della registrazione.
- Crea una cartella denominata
logsnella directory del connettore. Crea un file denominato
logging.propertiescon questo contenuto:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Passaggio 4: (Facoltativo) Configurare i tipi di media
Il connettore tenta di rilevare i tipi di media dei file utilizzando il meccanismo predefinito che, su Windows, si basa sulle voci del registro. Se manca una voce del registro per un'estensione di file, il connettore potrebbe non rilevare correttamente il tipo di media. Se i tipi di media non vengono rilevati correttamente o se vuoi ignorare il tipo predefinito per un'estensione, segui questi passaggi:
- Crea un file denominato
mime-type.propertiesnella directory del connettore. - Inserisci le estensioni e i tipi come
extension=media/type:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Passaggio 5: Esegui il connettore File Systems
Avvia il connettore dalla macchina host:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]Per impostazione predefinita, il connettore cerca un file di configurazione denominato
connector-config.properties nella directory in cui viene eseguito.
Se il file di configurazione ha un nome diverso o si trova in un'altra directory,
utilizza il parametro -Dconfig per specificarne il percorso.
Riferimento ai parametri di configurazione
Le tabelle seguenti elencano e descrivono i parametri utilizzati per configurare il connettore File Systems.
Accesso a origine dati
| Impostazione | Parametro |
| ID origine dati | api.sourceId=1234567890abcdef
Obbligatorio. L'ID origine Cloud Search. |
| Service account | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Obbligatorio. Il percorso al file della chiave del service account. |
| ID origine identità | api.identitySourceId=x0987654321
Obbligatorio. L'ID origine identità Cloud Search configurato dall'amministratore di Google Workspace per la sincronizzazione delle identità di Active Directory utilizzando GCDS. |
Accesso al file system
Utilizza questi parametri per specificare le origini del file system da scansionare.
| Impostazione | Parametro |
| File system di origine | fs.src=path1[,path2, ...]
Obbligatorio. Specifica i file system di origine come una o più origini UNC separate dal delimitatore configurato da |
Carattere separatore di percorso
| Impostazione | Parametro |
| Carattere separatore di percorso | fs.src.separator=separator-character
Il separatore predefinito è ";". Se i percorsi di origine contengono punti e virgola, puoi impostare un delimitatore diverso, ad esempio una virgola (","), che non sia in conflitto con i caratteri nei percorsi e non sia riservato dalla sintassi del file di proprietà. Se il valore di |
Comportamento del connettore
Utilizza questi parametri per ottimizzare la modalità di scansione dei file system da parte del connettore.
| Impostazione | Parametro |
| Dominio Windows | fs.supportedDomain=domain
Obbligatorio per consentire agli utenti configurati con GCDS di accedere ai documenti tramite Cloud Search. Specifica un singolo nome di dominio NetBIOS di Active Directory. |
| Includere gli account negli ACL | fs.supportedAccounts=account-1[, account-2,...]
Un elenco delimitato da virgole di account da includere negli ACL, indipendentemente dal fatto che siano account integrati. Il valore predefinito è |
| Escludere gli account integrati dagli elenchi di controllo dell'accesso | fs.builtinGroupPrefix=prefix
Specifica il prefisso degli account integrati. Un account che inizia con questo prefisso è considerato un account integrato e verrà escluso dagli ACL. Il valore predefinito è |
| Consenti l'indicizzazione di file e cartelle nascosti | fs.crawlHiddenFiles=boolean
Imposta su |
| Consenti l'indicizzazione degli elenchi di cartelle sottoposti a scansione e delle enumerazioni dello spazio dei nomi DFS | fs.indexFolders=boolean
Se impostato su |
| Abilita il monitoraggio delle modifiche al file system | fs.monitorForUpdates=boolean
Se impostato su |
| Imposta la dimensione massima della cache delle directory | fs.directoryCacheSize=number-of-entries
La dimensione massima della cache della directory. Il connettore utilizza la cache per identificare le cartelle nascoste ed evitare di indicizzare file e cartelle in queste cartelle. Il valore predefinito è 50.000 voci, che in genere consumano 10-15 megabyte di RAM. |
Conservazione del timestamp
Utilizza questi parametri per specificare in che modo il connettore gestisce la conservazione dei timestamp.
| Impostazione | Parametro |
| Conserva la data/ora di accesso | fs.preserveLastAccessTime=value
Durante la scansione di file e cartelle, il connettore può modificare il timestamp dell'ultimo accesso all'ora della scansione. Se gli orari dell'ultimo accesso non vengono conservati, i sistemi di backup e archiviazione potrebbero non spostare i file e le cartelle appropriati nello spazio di archiviazione secondario perché il connettore ha eseguito l'accesso. Per impostazione predefinita, I valori possibili includono:
|
| Eseguire la scansione solo dei file a cui è stato eseguito l'accesso dopo una determinata data | fs.lastAccessedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ultimo accesso è successivo alla data specificata
(formato AAAA-MM-GG, ISO8601).
Il valore predefinito è |
| Esegui la scansione solo dei file a cui è stato eseguito l'accesso negli ultimi giorni | fs.lastAccessedDays=number-of-days
Esegui la scansione dei contenuti solo se l'ultimo accesso rientra nel numero specificato di giorni a partire da oggi. Il valore predefinito è |
| Eseguire la scansione solo dei file modificati dopo una determinata data | fs.lastModifiedDate=YYYY-MM-DD
Esegui la scansione dei contenuti solo se l'ultima ora di modifica è successiva alla data specificata
(formato AAAA-MM-GG, ISO8601).
Il valore predefinito è |
| Esegui la scansione solo dei file modificati negli ultimi giorni | fs.lastModifiedDays=number-of-days
Esegui la scansione dei contenuti solo se l'ultima ora di modifica rientra nel numero di giorni specificato
a partire da oggi. Il valore predefinito è |
Ignora ACL condivisione file
Puoi impostare il connettore in modo che ignori gli elenchi di controllo dell'accesso alla condivisione se non dispone delle autorizzazioni per leggerli. I contenuti vengono quindi restituiti con un ACL di condivisione permissivo.
| Impostazione | Parametro |
| Ignora ACL di condivisione | fs.skipShareAccessControl=boolean
Imposta su |