Puedes configurar Google Cloud Search para que muestre resultados de los recursos compartidos de Microsoft Windows de tu organización, además del contenido de Google Workspace. Usas el conector de sistemas de archivos de Cloud Search y lo configuras para acceder a los recursos compartidos de Windows especificados. Una sola instancia de conector puede admitir varios recursos compartidos de Microsoft Windows.
Consideraciones importantes
Antes de implementar el conector de File Systems, revisa las siguientes consideraciones.
Actualizaciones automáticas continuas
De forma predeterminada, el conector supervisa continuamente las rutas de acceso de inicio (valores de fs.src en el archivo de configuración) cuando se inicia. Cuando el sistema de archivos informa cambios en el contenido o los controles de acceso, el conector vuelve a rastrear el sistema de archivos. Este nuevo rastreo puede consumir muchos recursos. Para desactivar la supervisión, establece fs.monitorForUpdates en false. Esto reduce el uso de recursos, pero retrasa el momento en que el conector refleja los cambios. Más información
Control de acceso de DFS
El sistema DFS aplica control de acceso en sus vínculos y, por lo general, cada vínculo DFS tiene su propia LCA. El DFS usa la enumeración basada en el acceso (ABE) para restringir los vínculos que se muestran a un usuario. Es posible que los usuarios solo vean un subconjunto de vínculos de DFS o solo un vínculo cuando la ABE aísla los directorios de página principal. Cuando recorre un sistema DFS, el conector respeta la LCA del vínculo de DFS y la LCA de los recursos compartidos de destino. La LCA de los recursos compartidos se hereda de la LCA de DFS.
Limitaciones conocidas
En esta sección, se enumeran las limitaciones conocidas del conector del sistema de archivos.
- Sistema de archivos: El conector no admite unidades asignadas ni locales.
- Sistema de archivos distribuidos: Una unidad asignada a un DFS con una UNC no funciona correctamente, y es posible que algunas LCA no se lean de manera adecuada.
- El conector admite los vínculos y los espacios de nombres DFS, pero no las carpetas normales en el espacio de nombres DFS.
- Los vínculos a archivos en
cloudsearch.google.como que devuelve la API de Query no se pueden hacer clic en la mayoría de los navegadores.
Requisitos del sistema
Antes de implementar el conector de File Systems, asegúrate de que la máquina host cumpla con los siguientes requisitos:
| Requisitos del sistema | |
|---|---|
| Sistema operativo |
|
| Software |
|
| Protocolos de sistemas de archivos |
No se admiten: Sistemas de archivos locales de Windows, NFS 2.0, NFS 3.0 ni sistemas de archivos locales de Linux. |
Implementa el conector
Sigue estos pasos para implementar el conector de sistemas de archivos.
Requisitos previos
Antes de implementar el conector, asegúrate de que tu entorno tenga estos componentes:
Información de Google Workspace para establecer conexiones:
- Clave privada de Google Workspace (que contiene el ID de la cuenta de servicio). Consulta Configura el acceso a la API de Cloud Search.
- Es el ID de la fuente de datos de Google Workspace. Consulta Agrega una fuente de datos a la búsqueda.
- Es el ID de una fuente de identidad. Consulta Crea una fuente de identidad. Si realizas la sincronización con Active Directory, usa GCDS.
Por lo general, tu administrador de Google Workspace puede proporcionarte estas credenciales.
Asegúrate de que la cuenta de Windows tenga los permisos necesarios.
Permisos obligatorios de la cuenta de Microsoft Windows
La cuenta de Windows que ejecuta el conector debe tener permisos para realizar las siguientes acciones:
- Mostrar el contenido de una carpeta
- Leer el contenido del documento
- Leer los atributos de archivos y carpetas
- Permisos de lectura (ACL) para archivos y carpetas
- Escribir atributos básicos
La membresía a uno de estos grupos suele otorgar permisos suficientes: Administradores, Usuarios avanzados, Operadores de impresión o Operadores de servidor.
Paso 1: Instala el conector
Descarga o clona el repositorio del conector desde GitHub y, luego, compila el paquete del conector.
Obtén el repositorio del conector de GitHub y compílalo.
Para usar Git en el servidor de Windows, haz lo siguiente:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
Para descargar directamente, sigue estos pasos:
- Ve a windows-filesystems-connector.
- Haz clic en Clonar o descargar > Descargar ZIP.
- Descomprime el paquete y ve al directorio.
Compila el conector con Apache Maven:
Para omitir pruebas, usa> mvn package
mvn package -DskipTests.Extrae el archivo ZIP del conector en el directorio de instalación:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Paso 2: Cree el archivo de configuración
Después de instalar el conector, crea un archivo de configuración que contenga los parámetros de configuración del conector.
- En el directorio del conector, crea un archivo llamado
connector-config.properties. Agrega parámetros como pares clave-valor. Por ejemplo:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDConsulta la referencia de los parámetros de configuración para ver los parámetros específicos del sistema de archivos. Para obtener una lista de los parámetros comunes que usan todos los conectores de Cloud Search, consulta Parámetros de conectores que proporciona Google.
Paso 3: Habilitar registro
Crea un directorio para los registros y un archivo de configuración de registro.
- Crea una carpeta llamada
logsen el directorio del conector. Crea un archivo llamado
logging.propertiescon este contenido:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Paso 4: Configura tipos de medios (opcional)
El conector intenta detectar los tipos de medios de los archivos con su mecanismo predeterminado que, en Windows, se basa en las entradas del registro. Si falta una entrada de registro para una extensión de archivo, es posible que el conector no detecte el tipo de medio correctamente. Si los tipos de medios no se detectan correctamente o si deseas anular el tipo predeterminado para una extensión, sigue estos pasos:
- Crea un archivo llamado
mime-type.propertiesen el directorio del conector. - Ingresa las extensiones y los tipos como
extension=media/type:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Paso 5: Ejecuta el conector de sistemas de archivos
Inicia el conector desde la máquina host:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]De forma predeterminada, el conector busca un archivo de configuración llamado connector-config.properties en el directorio en el que se ejecuta el conector.
Si tu archivo de configuración tiene un nombre diferente o se encuentra en otro directorio, usa el parámetro -Dconfig para especificar su ruta de acceso.
Referencia de los parámetros de configuración
En las siguientes tablas, se enumeran y describen los parámetros que se usan para configurar el conector de sistemas de archivos.
Acceso a la fuente de datos
| Configuración | Parámetro |
| ID de la fuente de datos | api.sourceId=1234567890abcdef
Obligatorio. Es el ID de la fuente de Cloud Search. |
| Cuenta de servicio | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Obligatorio. Es la ruta de acceso al archivo de claves de la cuenta de servicio. |
| ID de la fuente de identidad | api.identitySourceId=x0987654321
Obligatorio. El ID de la fuente de identidad de Cloud Search que configura el administrador de Google Workspace para sincronizar las identidades de directorios activos con GCDS |
Acceso al sistema de archivos
Usa estos parámetros para especificar las fuentes del sistema de archivos que se deben rastrear.
| Configuración | Parámetro |
| Sistemas de archivos fuente | fs.src=path1[,path2, ...]
Obligatorio. Especifica los sistemas de archivos de origen como una o más fuentes UNC separadas por el delimitador configurado por |
Carácter separador de ruta de acceso
| Configuración | Parámetro |
| Carácter separador de ruta de acceso | fs.src.separator=separator-character
El separador predeterminado es ";". Si tus rutas de acceso fuente contienen punto y coma, puedes establecer un delimitador diferente, como una coma (","), que no genere conflictos con los caracteres de la ruta de acceso y que no esté reservado por la propia sintaxis del archivo de propiedad. Si el valor de |
Comportamiento del conector
Usa estos parámetros para ajustar la forma en que el conector rastrea los sistemas de archivos.
| Configuración | Parámetro |
| Dominio de Windows | fs.supportedDomain=domain
Obligatorio para permitir que los usuarios que están configurados con GCDS accedan a los documentos a través de Cloud Search. Especifica un solo nombre de dominio NetBIOS de Active Directory. |
| Incluye cuentas en las LCA | fs.supportedAccounts=account-1[, account-2,...]
Es una lista de cuentas delimitada por comas que se incluirán en las LCA, independientemente de si son cuentas integradas. El valor predeterminado es |
| Excluye cuentas integradas de las LCA | fs.builtinGroupPrefix=prefix
Especifica el prefijo de las cuentas integradas. Una cuenta que comienza con este prefijo se considera una cuenta integrada y se excluirá de las LCA. El valor predeterminado es |
| Permite la indexación de archivos y carpetas ocultos | fs.crawlHiddenFiles=boolean
Configúralo como |
| Permite la indexación de las listas de carpetas rastreadas y las enumeraciones de los espacios de nombres DFS | fs.indexFolders=boolean
Cuando se configura como |
| Habilita la supervisión del cambio del sistema de archivos | fs.monitorForUpdates=boolean
Cuando se establece en |
| Establece el tamaño máximo de la caché de los directorios. | fs.directoryCacheSize=number-of-entries
Es el tamaño máximo de la caché de directorios. El conector usa la caché para identificar las carpetas ocultas y evitar indexar archivos y carpetas en ellas. El valor predeterminado es 50,000 entradas, que suelen consumir entre 10 y 15 megabytes de RAM. |
Conservación de marcas de tiempo
Usa estos parámetros para especificar cómo el conector controla la conservación de la marca de tiempo.
| Configuración | Parámetro |
| Conservar la hora de acceso | fs.preserveLastAccessTime=value
Cuando rastrea archivos y carpetas, el conector puede cambiar la marca de tiempo del último acceso a la hora del rastreo. Si no se conservan los horarios del último acceso, es posible que los sistemas de archivos y copias de seguridad no muevan los archivos y las carpetas adecuados al almacenamiento secundario porque el conector accedió a ellos. De forma predeterminada, Estos son algunos de los valores posibles:
|
| Rastrea solo los archivos a los que se accedió después de una fecha determinada | fs.lastAccessedDate=YYYY-MM-DD
Rastrea el contenido solo si la última hora de acceso es posterior a la fecha especificada (AAAA-MM-DD, formato ISO8601).
El valor predeterminado es |
| Rastrea solo los archivos a los que se accedió en los últimos días. | fs.lastAccessedDays=number-of-days
Rastrea el contenido solo si la última hora de acceso se encuentra dentro de la cantidad especificada de días a partir del presente. El valor predeterminado es |
| Solo se rastrean los archivos que se modificaron después de una fecha determinada. | fs.lastModifiedDate=YYYY-MM-DD
Rastrea el contenido solo si la hora de la última modificación es posterior a la fecha especificada (AAAA-MM-DD, formato ISO8601).
El valor predeterminado es |
| Rastrea solo los archivos que se modificaron en los últimos días. | fs.lastModifiedDays=number-of-days
Rastrea el contenido solo si la hora de la última modificación se encuentra dentro de la cantidad de días especificada a partir del presente. El valor predeterminado es |
Omite las LCA de los archivos compartidos
Puedes configurar el conector para que ignore las LCA de los archivos compartidos si no tiene permisos para leerlas. Luego, se muestra el contenido con una LCA de uso compartido permisiva.
| Configuración | Parámetro |
| Omitir las LCA de uso compartido | fs.skipShareAccessControl=boolean
Configúralo como |