Deployment del connettore file system di Microsoft Windows

Puoi configurare Google Cloud Search in modo che restituisca risultati dalle condivisioni Microsoft Windows della tua organizzazione oltre ai contenuti di Google Workspace. Utilizzi il connettore Cloud Search File Systems e lo configuri per accedere alle condivisioni Windows specificate. Una singola istanza del connettore può supportare più condivisioni di Microsoft Windows.

Considerazioni importanti

Prima di eseguire il deployment del connettore File Systems, esamina le seguenti considerazioni.

Aggiornamenti automatici continui

Per impostazione predefinita, il connettore monitora continuamente i percorsi di avvio (valori di fs.src nel file di configurazione) all'avvio. Quando il file system segnala modifiche ai controlli di accesso o ai contenuti, il connettore esegue nuovamente la scansione del file system. Questa nuova scansione può richiedere molte risorse. Per disattivare il monitoraggio, imposta fs.monitorForUpdates su false. In questo modo si riduce l'utilizzo delle risorse, ma si ritarda il momento in cui il connettore riflette le modifiche. Scopri di più

Controllo dell'accesso DFS

Il sistema DFS applica il controllo dell'accesso ai suoi link e in genere ogni link DFS ha il proprio ACL. DFS utilizza l'enumerazione basata sull'accesso (ABE) per limitare i link restituiti a un utente. Gli utenti potrebbero visualizzare solo un sottoinsieme di link DFS o un solo link quando ABE isola le home directory. Quando attraversa un sistema DFS, il connettore rispetta l'ACL del link DFS e l'ACL di condivisione della destinazione; l'ACL di condivisione eredita dall'ACL DFS.

Limitazioni note

Questa sezione elenca le limitazioni note del connettore del file system.

  • File system: il connettore non supporta le unità mappate o locali.
  • Distributed File System: un'unità mappata a un UNC DFS non funziona correttamente e alcune ACL potrebbero non essere lette correttamente.
  • Il connettore supporta spazi dei nomi e link DFS, ma non le cartelle normali nello spazio dei nomi DFS.
  • I link ai file in cloudsearch.google.com o restituiti dall'API Query non sono cliccabili nella maggior parte dei browser.

Requisiti di sistema

Prima di eseguire il deployment del connettore File Systems, assicurati che la macchina host soddisfi i seguenti requisiti:

Requisiti di sistema
Sistema operativo
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Software
  • Java JRE 1.8 installato sul computer che esegue il connettore
Protocolli del file system
  • Server Message Block (SMB) - SMB1
  • Server Message Block (SMB) - SMB2
  • Distributed File System (DFS)

Non supportati: file system Windows locali, NFS 2.0, NFS 3.0 o file system Linux locali.

Esegui il deployment del connettore

Segui questi passaggi per eseguire il deployment del connettore File Systems.

Prerequisiti

Prima di eseguire il deployment del connettore, assicurati che il tuo ambiente disponga di questi componenti:

Autorizzazioni account Microsoft Windows richieste

L'account Windows che esegue il connettore deve disporre delle autorizzazioni per:

  • Elenca i contenuti della cartella.
  • Leggi i contenuti del documento.
  • Leggere gli attributi di file e cartelle.
  • Autorizzazioni di lettura (ACL) per file e cartelle.
  • Scrivere gli attributi di base.

L'appartenenza a uno di questi gruppi in genere concede autorizzazioni sufficienti: amministratori, utenti avanzati, operatori di stampa o operatori del server.

Passaggio 1: Installa il connettore

Scarica o clona il repository del connettore da GitHub, quindi crea il pacchetto del connettore.

  1. Recupera il repository del connettore da GitHub e crealo.

    Per utilizzare git sul server Windows:

    > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
    > cd windows-filesystems-connector
    > git checkout tags/v1-0.0.3

    Per scaricare direttamente:

    1. Vai a windows-filesystems-connector.
    2. Fai clic su Clona o scarica > Scarica zip.
    3. Decomprimi il pacchetto e spostati nella directory.
  2. Crea il connettore utilizzando Apache Maven:

    > mvn package
    Per saltare i test, utilizza mvn package -DskipTests.

  3. Estrai il file ZIP del connettore nella directory di installazione:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

Passaggio 2: Crea il file di configurazione

Dopo aver installato il connettore, crea un file di configurazione che contenga le impostazioni del connettore.

  1. Nella directory del connettore, crea un file denominato connector-config.properties.
  2. Aggiungi i parametri come coppie chiave-valore. Ad esempio:

    # Required parameters
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # File system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace
    
    # Optional parameters
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Consulta il riferimento ai parametri di configurazione per i parametri specifici del file system. Per un elenco dei parametri comuni utilizzati da tutti i connettori Cloud Search, consulta Parametri del connettore forniti da Google.

Passaggio 3: Abilita il logging

Crea una directory per i log e un file di configurazione della registrazione.

  1. Crea una cartella denominata logs nella directory del connettore.
  2. Crea un file denominato logging.properties con questo contenuto:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

Passaggio 4: (Facoltativo) Configurare i tipi di media

Il connettore tenta di rilevare i tipi di media dei file utilizzando il meccanismo predefinito che, su Windows, si basa sulle voci del registro. Se manca una voce del registro per un'estensione di file, il connettore potrebbe non rilevare correttamente il tipo di media. Se i tipi di media non vengono rilevati correttamente o se vuoi ignorare il tipo predefinito per un'estensione, segui questi passaggi:

  1. Crea un file denominato mime-type.properties nella directory del connettore.
  2. Inserisci le estensioni e i tipi come extension=media/type: properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf

Passaggio 5: Esegui il connettore File Systems

Avvia il connettore dalla macchina host:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Per impostazione predefinita, il connettore cerca un file di configurazione denominato connector-config.properties nella directory in cui viene eseguito. Se il file di configurazione ha un nome diverso o si trova in un'altra directory, utilizza il parametro -Dconfig per specificarne il percorso.

Riferimento ai parametri di configurazione

Le tabelle seguenti elencano e descrivono i parametri utilizzati per configurare il connettore File Systems.

Accesso a origine dati

Impostazione Parametro
ID origine dati api.sourceId=1234567890abcdef

Obbligatorio. L'ID origine Cloud Search.

Service account api.serviceAccountPrivateKeyFile=./PrivateKey.json

Obbligatorio. Il percorso al file della chiave del service account.

ID origine identità api.identitySourceId=x0987654321

Obbligatorio. L'ID origine identità Cloud Search configurato dall'amministratore di Google Workspace per la sincronizzazione delle identità di Active Directory utilizzando GCDS.

Accesso al file system

Utilizza questi parametri per specificare le origini del file system da scansionare.

Impostazione Parametro
File system di origine fs.src=path1[,path2, ...]

Obbligatorio. Specifica i file system di origine come una o più origini UNC separate dal delimitatore configurato da fs.src.separator. Se utilizzi caratteri non presenti in Latin1, codificali con i caratteri di escape Unicode di Java.

Carattere separatore di percorso

Impostazione Parametro
Carattere separatore di percorso fs.src.separator=separator-character

Il separatore predefinito è ";". Se i percorsi di origine contengono punti e virgola, puoi impostare un delimitatore diverso, ad esempio una virgola (","), che non sia in conflitto con i caratteri nei percorsi e non sia riservato dalla sintassi del file di proprietà.

Se il valore di fs.src.separator è una stringa vuota, il valore di fs.src viene trattato come un singolo percorso.

Comportamento del connettore

Utilizza questi parametri per ottimizzare la modalità di scansione dei file system da parte del connettore.

Impostazione Parametro
Dominio Windows fs.supportedDomain=domain

Obbligatorio per consentire agli utenti configurati con GCDS di accedere ai documenti tramite Cloud Search. Specifica un singolo nome di dominio NetBIOS di Active Directory.

Includere gli account negli ACL fs.supportedAccounts=account-1[, account-2,...]

Un elenco delimitato da virgole di account da includere negli ACL, indipendentemente dal fatto che siano account integrati.

Il valore predefinito è BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

Escludere gli account integrati dagli elenchi di controllo dell'accesso fs.builtinGroupPrefix=prefix

Specifica il prefisso degli account integrati. Un account che inizia con questo prefisso è considerato un account integrato e verrà escluso dagli ACL.

Il valore predefinito è BUILTIN\\

Consenti l'indicizzazione di file e cartelle nascosti fs.crawlHiddenFiles=boolean

Imposta su true per eseguire la scansione dei file nascosti. Il valore predefinito è false.

Consenti l'indicizzazione degli elenchi di cartelle sottoposti a scansione e delle enumerazioni dello spazio dei nomi DFS fs.indexFolders=boolean

Se impostato su true (impostazione predefinita), quando il connettore esegue la scansione di una cartella, crea un oggetto CONTAINER_ITEM. Se impostato su false, il connettore crea invece un oggetto VIRTUAL_CONTAINER_ITEM.

Abilita il monitoraggio delle modifiche al file system fs.monitorForUpdates=boolean

Se impostato su true (impostazione predefinita), il connettore esegue nuovamente la scansione automatica in caso di modifiche ai contenuti o ai controlli dell'accesso. Se imposti questo valore su false, l'utilizzo delle risorse viene ridotto, ma i tempi di applicazione delle modifiche ai risultati di ricerca vengono ritardati.

Imposta la dimensione massima della cache delle directory fs.directoryCacheSize=number-of-entries

La dimensione massima della cache della directory. Il connettore utilizza la cache per identificare le cartelle nascoste ed evitare di indicizzare file e cartelle in queste cartelle.

Il valore predefinito è 50.000 voci, che in genere consumano 10-15 megabyte di RAM.

Conservazione del timestamp

Utilizza questi parametri per specificare in che modo il connettore gestisce la conservazione dei timestamp.

Impostazione Parametro
Conserva la data/ora di accesso fs.preserveLastAccessTime=value

Durante la scansione di file e cartelle, il connettore può modificare il timestamp dell'ultimo accesso all'ora della scansione. Se gli orari dell'ultimo accesso non vengono conservati, i sistemi di backup e archiviazione potrebbero non spostare i file e le cartelle appropriati nello spazio di archiviazione secondario perché il connettore ha eseguito l'accesso.

Per impostazione predefinita, fs.preserveLastAccessTime è impostato su ALWAYS, il che significa che il connettore tenta di preservare l'ultimo orario di accesso. Se l'account utente che esegue il connettore non dispone dei privilegi per scrivere gli attributi dei file, il connettore non può ripristinare l'ultima ora di accesso. Se è impostato su ALWAYS e il connettore non può conservare l'ultimo orario di accesso, rifiuta le richieste di scansione per il file system in modo da non alterare i timestamp dei file.

I valori possibili includono:

  • ALWAYS: Il connettore tenta di preservare l'ultima ora di accesso durante la scansione di file e cartelle. Se non riesce a conservare l'ultima ora di accesso, rifiuta tutte le richieste di scansione successive per il file system per impedire la modifica dei timestamp.
  • IF_ALLOWED: il connettore tenta di preservare l'ultima ora di accesso durante la scansione di file e cartelle. Continua a eseguire la scansione anche se alcuni timestamp potrebbero non essere conservati.
  • NEVER: il connettore non tenta di conservare l'ultima ora di accesso.
Eseguire la scansione solo dei file a cui è stato eseguito l'accesso dopo una determinata data fs.lastAccessedDate=YYYY-MM-DD

Esegui la scansione dei contenuti solo se l'ultimo accesso è successivo alla data specificata (formato AAAA-MM-GG, ISO8601). Il valore predefinito è disabled. Ad esempio, 2010-01-01 esegue la scansione dei contenuti a cui è stato eseguito l'accesso dopo l'inizio del 2010. Non può essere utilizzato con fs.lastAccessedDays.

Esegui la scansione solo dei file a cui è stato eseguito l'accesso negli ultimi giorni fs.lastAccessedDays=number-of-days

Esegui la scansione dei contenuti solo se l'ultimo accesso rientra nel numero specificato di giorni a partire da oggi. Il valore predefinito è disabled. Utile per i contenuti obsoleti in scadenza, ad es. 365 esegue la scansione dei contenuti a cui è stato eseguito l'accesso nell'ultimo anno. Non può essere utilizzato con fs.lastAccessedDate.

Eseguire la scansione solo dei file modificati dopo una determinata data fs.lastModifiedDate=YYYY-MM-DD

Esegui la scansione dei contenuti solo se l'ultima ora di modifica è successiva alla data specificata (formato AAAA-MM-GG, ISO8601). Il valore predefinito è disabled. Ad esempio, 2010-01-01 esegue la scansione dei contenuti modificati dopo l'inizio del 2010. Non può essere utilizzato con fs.lastModifiedDays.

Esegui la scansione solo dei file modificati negli ultimi giorni fs.lastModifiedDays=number-of-days

Esegui la scansione dei contenuti solo se l'ultima ora di modifica rientra nel numero di giorni specificato a partire da oggi. Il valore predefinito è disabled. Utile per far scadere i contenuti meno recenti, ad esempio 365 esegue la scansione dei contenuti modificati nell'ultimo anno. Non può essere utilizzato con fs.lastModifiedDate.

Ignora ACL condivisione file

Puoi impostare il connettore in modo che ignori gli elenchi di controllo dell'accesso alla condivisione se non dispone delle autorizzazioni per leggerli. I contenuti vengono quindi restituiti con un ACL di condivisione permissivo.

Impostazione Parametro
Ignora ACL di condivisione fs.skipShareAccessControl=boolean

Imposta su true per ignorare gli ACL di condivisione. Il valore predefinito è false.