Deployment del connettore file system di Microsoft Windows

Puoi configurare Google Cloud Search in modo che restituisca risultati dalle condivisioni Microsoft Windows della tua organizzazione, oltre ai tuoi contenuti di Google Workspace. Puoi utilizzare il connettore file system di Google Cloud Search e configurarlo in modo che acceda alle condivisioni Windows specificate. Una singola istanza del connettore può supportare più condivisioni Microsoft Windows.

Considerazioni importanti

Aggiornamenti automatici continui

Per impostazione predefinita, il connettore monitora continuamente i percorsi di avvio (valori compresi in fs.src nel file di configurazione del connettore) all'avvio. Quando il file system segnala le modifiche apportate ai contenuti o ai controlli di accesso, il connettore viene attivato per eseguire nuovamente la scansione del file system. Questa nuova scansione può richiedere molte risorse. Per disattivare il monitoraggio del file system, imposta fs.monitorForUpdates su false. Riducono in modo significativo l'utilizzo delle risorse del connettore, ma si verifica un ritardo nel momento in cui il connettore riflette le modifiche. Scopri di più

Controllo dell'accesso DFS

Il sistema DFS applica il controllo dell'accesso ai propri collegamenti e di solito ogni link DFS ha il proprio ACL. Un meccanismo utilizzato da DFS è l'enumerazione basata sugli accessi (ABE), che può limitare i link DFS restituiti a un utente. Gli utenti potrebbero visualizzare solo un sottoinsieme di link DFS o anche un solo link quando ABE isola le home directory ospitate. Quando il connettore attraversa un sistema DFS, rispetta l'ACL del collegamento DFS e l'ACL di condivisione della destinazione, mentre l'ACL di condivisione eredita dall'ACL di DFS.

Limitazioni note

  • File system: il connettore per file system non supporta le unità mappate e le unità locali.
  • File system distribuito: un'unità mappata a un DFS UNC non funziona correttamente. Alcuni ACL non vengono letti correttamente.
  • Il connettore per file system supporta gli spazi dei nomi e i collegamenti Distributed File System (DFS). Tuttavia, il connettore supporta i collegamenti DFS solo in uno spazio dei nomi DFS, non nelle cartelle normali nello spazio dei nomi DFS.
  • I link ai file restituiti in cloudsearch.google.com non sono cliccabili. Neanche i link ai file restituiti dall'API Query sono cliccabili nella maggior parte dei browser.

Requisiti di sistema

Requisiti di sistema
Sistema operativo
  • Windows Server 2016
  • Windows Server 2012
  • Windows Server 2008 R2
Software
  • Java JRE 1.8 installato sul computer su cui verrà eseguito il connettore File Systems di Google Cloud Search
Protocolli del file system
  • Blocco messaggi server (SMB) - SMB1
  • Blocco messaggi server (SMB) - SMB2
  • File system distribuito (DFS)

Non supportati:file system Windows locali, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 o file system Linux locale.

Eseguire il deployment del connettore

Prerequisiti

Prima di eseguire il deployment del connettore per i file system di Cloud Search, assicurati che il tuo ambiente abbia tutti i componenti prerequisiti riportati di seguito:

Autorizzazioni obbligatorie per l'account Microsoft Windows

L'account Microsoft Windows su cui è in esecuzione il connettore deve disporre di autorizzazioni sufficienti per eseguire le seguenti azioni:

  • Elenca i contenuti delle cartelle
  • Leggi il contenuto dei documenti
  • Leggi gli attributi di file e cartelle
  • Autorizzazioni di lettura (ACL) per file e cartelle
  • Scrivere le autorizzazioni di base degli attributi

L'appartenenza a uno dei seguenti gruppi concede a un account Windows le autorizzazioni sufficienti necessarie dal connettore:

  • Amministratori
  • Utenti esperti
  • Operatori di stampa
  • Operatori server

Passaggio 1: Installare il connettore per file system di Google Cloud Search

  1. Scarica il repository del connettore da GitHub e crealo.

    Per utilizzare Git sul server Windows:

    1. Clona il repository:

      > git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git
      > cd windows-filesystems-connector
    2. Controlla la versione desiderata del connettore:

      > git checkout tags/v1-0.0.3

    Per scaricare direttamente da GitHub:

    1. Vai a https://github.com/google-cloudsearch/windows-filesystems-connector.
    2. Fai clic su Clona o scarica Scarica zip.
    3. Decomprimi il pacchetto.
    4. Passa alla nuova directory:
      > cd windows-filesystems-connector
  2. Crea il connettore. Se necessario, installa Apache Maven.

    > mvn package

    Per saltare i test quando crei il connettore, esegui mvn package -DskipTests anziché mvn package.

  3. Copia il file ZIP del connettore nella directory di installazione locale:

    > cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir
    > cd installation-dir
    > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip
    > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3

Passaggio 2: Crea il file di configurazione del connettore

  1. Nella stessa directory in cui si trova l'installazione del connettore, crea un file e assegnagli il nome connector-config.properties.

  2. Aggiungi i parametri come coppie chiave/valore ai contenuti del file, come nell'esempio seguente:

    ### File system connector configuration ###
    
    # Required parameters for Cloud Search data source and identity source access
    api.serviceAccountPrivateKeyFile=/path/to/file.json
    api.sourceId=0123456789abcde
    api.identitySourceId=a1b1c1234567
    
    # Required parameters for file system access
    fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link
    
    # Optional parameters for file system monitoring
    traverse.abortAfterExceptions=500
    fs.monitorForUpdates = true
    fs.preserveLastAccessTime = IF_ALLOWED
    

    Per una descrizione dettagliata di ciascun parametro, consulta il riferimento sui parametri di configurazione.

  3. (Facoltativo) Configura altri parametri del connettore in base alle esigenze. Per maggiori dettagli, vai a Parametri dei connettori forniti da Google.

Passaggio 3: Abilita il logging

  1. Crea una cartella denominata logs nella directory che contiene il file binario del connettore.
  2. Crea un file ASCII o UTF-8 denominato logging.properties nella directory che contiene il programma binario del connettore e aggiungi il contenuto seguente:

    handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
    # Default log level
    .level = WARNING
    com.google.enterprise.cloudsearch.level = INFO
    com.google.enterprise.cloudsearch.fs.level = INFO
    
    # uncomment line below to increase logging level to enable API trace
    #com.google.api.client.http.level = FINE
    java.util.logging.ConsoleHandler.level = INFO
    java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log
    java.util.logging.FileHandler.limit=10485760
    java.util.logging.FileHandler.count=10
    java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
    

Passaggio 4: (Facoltativo) Configurare i tipi di contenuti multimediali

Per impostazione predefinita, il connettore tenta di rilevare il tipo di media per ogni file con rilevamento del tipo di media fornito da JDK. Su Microsoft Windows, JDK si basa sul registro di Windows per determinare i tipi di contenuti multimediali per i file. Una voce di registro mancante può comportare un tipo di supporto nullo per alcuni file.

Se necessario, puoi specificare un tipo di supporto che sovrascriva eventuali associazioni esistenti o impedisca un tipo di media null.

  1. Nella directory del connettore, crea un file criptato con caratteri Latin-1 denominato mime-type.properties.
  2. Inserisci le estensioni dei file e i tipi multimediali corrispondenti, come indicato nei seguenti esempi:

    xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
    one=application/msonenote
    txt=text/plain
    pdf=application/pdf
    

Passaggio 5: esegui il connettore File System

Dopo aver installato e configurato il connettore per i file system, per avviarlo sulla macchina host esegui un comando come nell'esempio seguente:

> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]

Specifica il percorso del file di configurazione se è diverso da quello predefinito (nella stessa directory del file binario con nome connector-config.properties).

Riferimento ai parametri di configurazione

Accesso all'origine dati

Impostazione Parametro
ID origine dati api.sourceId=1234567890abcdef

obbligatorio. L'ID origine di Google Cloud Search configurato dall'amministratore di Google Workspace.

Percorso del file di chiave privata dell'account di servizio api.serviceAccountPrivateKeyFile=./PrivateKey.json

obbligatorio. Il file della chiave dell'account di servizio di Google Cloud Search per l'accessibilità del connettore file system di Google Cloud Search.

ID origine identità api.identitySourceId=x0987654321

obbligatorio. L'ID origine identità di Cloud Search configurato dall'amministratore di Google Workspace per sincronizzare le identità Active Directory utilizzando GCDS.

Accesso al file system

Impostazione Parametro
File system di origine fs.src=path1[,path2, ...]

obbligatorio. Specifica i file system di origine come una o più origini UNC separate dal delimitatore configurato da fs.src.separator. Se utilizzi caratteri non in Latin1, codificali con escape Java Unicode.

Carattere separatore di percorso

Impostazione Parametro
Carattere separatore di percorso fs.src.separator=separator-character

Il separatore predefinito è ";". Se i percorsi di origine contengono punti e virgola, puoi impostare un delimitatore diverso, ad esempio una virgola (","), che non entri in conflitto con i caratteri nei percorsi e non sia riservato dalla sintassi del file di proprietà.

Se il valore fs.src.separator è una stringa vuota, il valore fs.src viene considerato come un singolo percorso.

Comportamento del connettore

Impostazione Parametro
Dominio Windows fs.supportedDomain=domain

Obbligatorio per consentire agli utenti che hanno configurato GCDS di accedere ai documenti tramite Cloud Search. Specifica come nome di dominio NetBIOS singolo di Active Directory.

Includi account in ACLS fs.supportedAccounts=account-1[, account-2,...]

Un elenco di account separati da virgole da includere negli ACL, a prescindere dal fatto che siano account integrati.

Il valore predefinito è BUILTIN\\Administrators,Everyone,BUILTIN\\Users, BUILTIN\\Guest,NT AUTHORITY\\INTERACTIVE, NT AUTHORITY\\Authenticated Users

Escludi gli account integrati dagli ACL fs.builtinGroupPrefix=prefix

Specifica il prefisso degli account integrati. Un account che inizia con questo prefisso è considerato un account integrato e verrà escluso dagli ACL.

Il valore predefinito è BUILTIN\\

Consenti l'indicizzazione di file e cartelle nascosti fs.crawlHiddenFiles=boolean

Imposta su true per consentire al connettore di eseguire la scansione di file e cartelle nascosti (nei file system di Windows, un file o una cartella sono considerati nascosti se è impostato l'attributo DOS nascosto). Il valore predefinito è false.

Consenti l'indicizzazione delle schede delle cartelle sottoposte a scansione e delle enumerazioni dello spazio dei nomi DFS fs.indexFolders=boolean

Se impostato su true (impostazione predefinita), quando il connettore esegue la scansione di una cartella, crea un oggetto CONTAINER_ITEM. Se impostato su false, il connettore crea invece un oggetto VIRTUAL_CONTAINER_ITEM.

Abilita il monitoraggio delle modifiche al file system fs.monitorForUpdates=boolean

Se il criterio viene impostato su true (impostazione predefinita), le modifiche ai contenuti o ai controlli di accesso attivano la nuova scansione del connettore. Se disattivi il monitoraggio (impostato su false), riduci in modo significativo l'utilizzo di risorse del connettore, ma non il ritardo nel momento in cui il connettore riflette le modifiche.

Imposta la dimensione massima della cache delle directory fs.directoryCacheSize=number-of-entries

La dimensione massima della cache di directory. Il connettore utilizza la cache per identificare le cartelle nascoste per evitare di indicizzare file e cartelle in cartelle nascoste.

Il valore predefinito è 50.000 voci, che in genere consumano 10-15 megabyte di RAM.

Conservazione del timestamp e controllo della scansione

Impostazione Parametro
Conserva timestamp ultimo accesso fs.preserveLastAccessTime=value

Quando il connettore esegue la scansione di file e cartelle, può modificare il timestamp dell'ultimo accesso a file e cartelle specificando l'ora della scansione. Quando non vengono conservati gli orari dell'ultimo accesso, i sistemi di backup e archiviazione potrebbero non spostare i file e le cartelle appropriati nello spazio di archiviazione secondario a causa della visita del connettore.

Per impostazione predefinita, il connettore tenta di conservare la data e l'ora dell'ultimo accesso (fs.preserveLastAccessTime impostato su ALWAYS). Il connettore potrebbe non essere in grado di ripristinare la data e l'ora dell'ultimo accesso al file se l'utente di attraversamento non dispone di privilegi sufficienti per scrivere attributi di file. Se impostato su ALWAYS, il connettore rifiuta le richieste di scansione per il file system in modo da non alterare i timestamp dell'ultimo accesso ai file.

Valori possibili:

  • ALWAYS: il connettore tenta di conservare la data e l'ora dell'ultimo accesso durante la scansione di file e cartelle. La prima volta che il connettore non riesce a conservare l'ora dell'ultimo accesso, rifiuta tutte le successive richieste di scansione per il file system per impedire la modifica dei timestamp dell'ultimo accesso.
  • IF_ALLOWED: il connettore tenta di conservare la data e l'ora dell'ultimo accesso durante la scansione di file e cartelle. Continua a eseguire la scansione anche se alcuni timestamp potrebbero non essere conservati.
  • NEVER: il connettore non tenta di conservare l'ora dell'ultimo accesso mentre esegue la scansione di file e cartelle.
Esegui la scansione solo dei file a cui è stato eseguito l'accesso dopo una determinata data fs.lastAccessedDate=YYYY-MM-DD

Esegui la scansione dei contenuti solo se l'ora dell'ultimo accesso è successiva alla data specificata. Il valore predefinito è disabled.

Specifica la data nel formato data ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 2010-01-01, il connettore esegue la scansione solo del contenuto a cui si accedeva dopo l'inizio del 2010.

Se specifichi fs.lastAccessedDate, non puoi impostare anche un valore per fs.lastAccessedDays.

Esegui la scansione solo dei file a cui è stato eseguito l'accesso negli ultimi giorni fs.lastAccessedDays=number-of-days

Eseguire la scansione dei contenuti solo se la data e l'ora dell'ultimo accesso rientrano nel numero di giorni prima della presente. Il valore predefinito è disabled.

Utilizza questa proprietà per far scadere in anticipo contenuti indicizzati che non vengono consultati da un po' di tempo. Ad esempio, puoi impostare 365 per eseguire la scansione dei contenuti solo se si è verificato l'accesso nell'ultimo anno.

Se specifichi fs.lastAccessedDays, non puoi impostare anche un valore per fs.lastAccessedDate.

Esegui la scansione solo dei file modificati dopo una determinata data fs.lastModifiedDate=YYYY-MM-DD

Esegui la scansione dei contenuti solo se l'ora dell'ultima modifica è successiva alla data specificata. Il valore predefinito è disabled.

Specifica la data nel formato data ISO8601: AAAA-MM-GG. Ad esempio, se il valore è 2010-01-01, il connettore esegue la scansione solo del contenuto che è stato modificato dopo l'inizio del 2010.

Se specifichi fs.lastModifiedDate, non puoi impostare anche un valore per fs.lastModifiedDays.

Esegui la scansione solo dei file modificati nell'ultimo numero di giorni fs.lastModifiedDays=number-of-days

Esegui la scansione dei contenuti solo se la data e l'ora dell'ultima modifica rientrano nel numero di giorni precedenti la data presente. Il valore predefinito è disabled.

Utilizza questa proprietà per far scadere i contenuti indicizzati in precedenza che non sono stati modificati da un po' di tempo. Ad esempio, puoi impostare 365 per eseguire la scansione dei contenuti solo se sono stati modificati nell'ultimo anno.

Se specifichi fs.lastModifiedDays, non puoi impostare anche un valore per fs.lastModifiedDate.

Ignora il controllo dell'accesso per la condivisione file

Per impostazione predefinita, il connettore conserva l'integrità del controllo dell'accesso quando invia elenchi di controllo dell'accesso (ACL) all'API di indicizzazione, compresi gli ACL nella condivisione file. In alcune configurazioni, tuttavia, il connettore potrebbe non disporre di autorizzazioni sufficienti per leggere l'ACL di condivisione. In questi casi, il connettore non restituisce nei risultati di ricerca alcun file mantenuto su quella condivisione file.

Puoi impostare il connettore in modo che ignori l'ACL di condivisione in modo che i contenuti vengano sempre restituiti nei risultati di ricerca. In questo caso, l'API di indicizzazione riceve un ACL di condivisione completamente permissivo, anziché l'effettivo ACL di condivisione.

Impostazione Parametro
Ignora il controllo dell'accesso per la condivisione file fs.skipShareAccessControl=boolean

Imposta su false (impostazione predefinita) per applicare gli ACL di condivisione. Imposta su true per ignorare gli ACL di condivisione.