Implementa el conector de Microsoft SharePoint On-Premises

Puedes configurar Google Cloud Search para que muestre resultados del contenido local de SharePoint de tu organización, además del contenido de Google Workspace. Usa el conector local de SharePoint de Cloud Search y configúralo para acceder a una fuente de datos específica de SharePoint.

Consideraciones importantes

Antes de implementar el conector de SharePoint On-premises, ten en cuenta las siguientes consideraciones.

Configuración de SharePoint respetada

El conector siempre respeta el parámetro de configuración Visibilidad de búsqueda en SharePoint. En el caso de los documentos en borrador, los permisos de la cuenta de usuario que usa el conector para acceder a SharePoint controlan qué documentos indexa y devuelve. Si la cuenta tiene permisos de "Lectura completa", el conector respeta la configuración de "Visibilidad de elementos en borrador".

También puedes limitar los resultados según el acceso a la cuenta de usuario con principales externos y de Google para definir LCA. Para aplicar el recorte de seguridad, sincroniza estas identidades externas con el directorio de Google Cloud:

  • Usuarios y grupos de Active Directory
  • Grupos locales de SharePoint (con grupos y usuarios de Active Directory como miembros)

Para sincronizar los usuarios y grupos de AD, usa Google Cloud Directory Sync y habilita los grupos de identidad asignados. Para los grupos locales de SharePoint, usa el conector de identidad de SharePoint.

El conector también realiza búsquedas en Active Directory para recuperar información para sincronizar entidades principales, como la asignación de SID a sAMAccountNames.

Optimización de la búsqueda

Mejora la experiencia de búsqueda configurando el conector para que devuelva resultados relevantes. Usa los parámetros de generación de HTML en el archivo de configuración para establecer los niveles de impacto de los campos.

Para configurar un esquema, consulta Crea y registra un esquema. Cuando configures un esquema, ten en cuenta lo siguiente:

  • El conector normaliza los tipos de contenido de SharePoint en nombres de definiciones de objetos válidos (A-Z, a-z, 0-9). Por ejemplo, "Artículo de noticias" se convierte en "ArtículoDeNoticias".
  • Si el conector no puede encontrar una definición de objeto coincidente, usa el tipo de objeto de resguardo (itemMetadata.objectType). Consulta Parámetros de configuración de metadatos.
  • El conector normaliza los nombres de las propiedades decodificando los caracteres hexadecimales y quitando los prefijos "ows_".

Control de mensajes de Microsoft Outlook

El conector anula el tipo de medio para los archivos .msg de Microsoft Outlook y los indexa como application/vnd.ms-outlook.

Configuraciones de múltiples instancias

Para las implementaciones de múltiples instancias, configura el modo de colección de sitios:

  • Otorga permisos de administrador de colección de sitios a la cuenta del conector.
  • Establece sharepoint.server en la URL de la colección de sitios (p.ej., http://sharepoint.example.com/sites/collection).
  • Establece sharepoint.siteCollectionOnly en true.

Configura una instancia del conector por colección de sitios.

Limitaciones conocidas

  • El tiempo de detección de los cambios aumenta con la cantidad de bases de datos supervisadas.
  • El uso de memoria aumenta con la cantidad de usuarios y grupos únicos en las LCA.
  • El conector solo admite identidades de un dominio de Active Directory.
  • Las notificaciones de eliminación pueden tardar más de cuatro horas en propagarse.

Requisitos del sistema

Requisitos del sistema
Sistema operativo Windows Server 2016, Ubuntu, Red Hat Enterprise Linux 5.0 o SUSE Enterprise Linux 10 (64 bits).
Software SharePoint Server 2013 o 2016; Java JRE 1.8
Autenticación NTLM, Kerberos, HTTP Basic o ADFS.

Implementa el conector

Sigue estos pasos para implementar el conector de SharePoint On-premises.

Requisitos previos

  1. Crea una clave privada de Google Workspace. Consulta Configura el acceso a la API de Cloud Search.
  2. Agrega una fuente de datos para buscar y registrar su ID. Consulta Agrega una fuente de datos a la búsqueda.
  3. En el caso de los resultados basados en LCA, tu administrador debe crear dos fuentes de identidad (una para Active Directory y otra para los grupos locales de SharePoint) y proporcionar el ID de cliente de Google Workspace. Consulta Cómo asignar identidades de usuarios.
  4. Configura una cuenta de usuario para el conector con permisos de lectura completa.
  5. Asegúrate de que la aplicación web de SharePoint tenga una colección de sitios raíz.
  6. Si las colecciones de sitios están bloqueadas para escritura, ejecuta la secuencia de comandos PrepareWriteLockedSites.ps1.

Paso 1: Instala el software del conector

  1. Clona el repositorio:
    $ git clone https://github.com/google-cloudsearch/sharepoint-connector.git
    $ cd sharepoint-connector
  2. Revisa la versión seleccionada (p.ej., v1-0.0.5):
    $ git checkout tags/v1-0.0.5
  3. Compila el conector:
    $ mvn package
    Para omitir pruebas, usa mvn package -DskipTests.
  4. Extrae el archivo ZIP en el directorio de instalación.

Paso 2: Cree el archivo de configuración

Crea connector-config.properties en el directorio de instalación. Agrega parámetros como pares clave-valor:

api.sourceId=08ef8becd116faa4546b8ca2c84b2879
api.serviceAccountPrivateKeyFile=service_account.json
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
sharepoint.server=http://sp-2016:32967/sites/collection
sharepoint.siteCollectionOnly=true
sharepoint.username=contoso\\admin
sharepoint.password=password
adLookup.host=dc.contoso.com
adLookup.username=contoso\\admin
adLookup.password=password

Consulta la referencia o los parámetros proporcionados por Google para obtener más detalles.

Paso 3: Agrega SharePoint como un host confiable (HTTPS)

Si usas HTTPS, exporta el certificado de SharePoint y, luego, impórtalo al almacén de claves del conector:

$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint

Paso 4: Configura el registro

Crea una carpeta logs y un archivo logging.properties con este contenido: properties handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler .level = INFO java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log

Paso 5: Configura el conector de identidad

Para aplicar LCA basadas en la identidad, crea sharepoint-onprem-identity-connector.config con tu api.customerId y otros parámetros de conexión.

Paso 6: Cómo iniciar el conector

  1. Ejecuta GCDS para sincronizar los usuarios y grupos de Active Directory.
  2. Ejecuta el conector de identidad de SharePoint para sincronizar los grupos de colecciones de sitios.
  3. Ejecuta el conector de SharePoint On-premises para indexar contenido.

Referencia de los parámetros de configuración

En las siguientes secciones, se enumeran los parámetros de configuración que se usan para configurar el conector de SharePoint On-Prem.

Acceso a la fuente de datos

Configuración Parámetro
ID de la fuente de datos api.sourceId=ID
Cuenta de servicio api.serviceAccountPrivateKeyFile=path

Acceso local a SharePoint

Configuración Parámetro
URL del servidor sharepoint.server=URL
Credenciales sharepoint.username y sharepoint.password

Generación de contenido HTML

Configuración Parámetro
Campo de título contentTemplate.sharePointItem.title=Title
Campos de calidad contentTemplate.sharePointItem.quality.high, medium o low