Microsoft SharePoint 온프레미스 커넥터 배포

Google Workspace 콘텐츠 외에도 조직의 SharePoint 온프레미스 콘텐츠에서 결과를 반환하도록 Google Cloud Search를 설정할 수 있습니다. Cloud Search SharePoint 온프레미스 커넥터를 사용하고 특정 SharePoint 데이터 소스에 액세스하도록 구성합니다.

중요 고려사항

SharePoint 온프레미스 커넥터를 배포하기 전에 다음 고려사항을 확인하세요.

SharePoint 설정 준수

커넥터는 항상 SharePoint의 검색 공개 상태 설정을 따릅니다. 임시 문서의 경우 커넥터가 SharePoint에 액세스하는 데 사용하는 사용자 계정의 권한에 따라 색인을 생성하고 반환하는 문서가 제어됩니다. 계정에 '전체 읽기' 권한이 있으면 커넥터는 '임시 항목 공개 상태' 설정을 따릅니다.

Google 및 외부 주 구성원을 사용하여 ACL을 정의하여 사용자 계정 액세스를 기반으로 결과를 제한할 수도 있습니다. 보안 트리밍을 적용하려면 다음 외부 ID를 Google Cloud 디렉터리와 동기화하세요.

  • Active Directory 사용자 및 그룹
  • SharePoint 로컬 그룹 (Active Directory 사용자 및 그룹을 구성원으로 포함)

AD 사용자 및 그룹을 동기화하려면 Google Cloud 디렉터리 동기화를 사용하고 ID 매핑된 그룹을 사용 설정하세요. SharePoint 로컬 그룹의 경우 SharePoint ID 커넥터를 사용합니다.

또한 커넥터는 Active Directory 조회를 실행하여 SID를 sAMAccountName에 매핑하는 등 주체를 동기화하기 위한 정보를 가져옵니다.

검색 최적화

커넥터를 구성하여 관련 결과를 반환하도록 하여 검색 환경을 개선합니다. 구성 파일의 HTML 생성 매개변수를 사용하여 필드 영향 수준을 설정합니다.

스키마를 설정하려면 스키마 생성 및 등록하기를 참고하세요. 스키마를 설정할 때는 다음 사항을 고려하세요.

  • 커넥터는 SharePoint 콘텐츠 유형을 유효한 객체 정의 이름 (A~Z, a~z, 0~9)으로 정규화합니다. 예를 들어 '뉴스 기사'는 'NewsArticle'이 됩니다.
  • 커넥터가 객체 정의를 일치시킬 수 없는 경우 대체 객체 유형 (itemMetadata.objectType)을 사용합니다. 메타데이터 구성 매개변수를 참고하세요.
  • 커넥터는 16진수 문자를 디코딩하고 'ows_' 접두사를 삭제하여 속성 이름을 정규화합니다.

Microsoft Outlook 메시지 처리

커넥터는 Microsoft Outlook .msg 파일의 미디어 유형을 재정의하고 application/vnd.ms-outlook으로 색인을 생성합니다.

멀티 테넌트 구성

멀티 테넌트 배포의 경우 사이트 모음 모드를 구성합니다.

  • 커넥터 계정에 사이트 모음 관리자 권한을 부여합니다.
  • sharepoint.server을 사이트 모음 URL로 설정합니다 (예: http://sharepoint.example.com/sites/collection))를 제공합니다.
  • sharepoint.siteCollectionOnlytrue로 설정합니다.

사이트 모음당 하나의 커넥터 인스턴스를 구성합니다.

알려진 제한사항

  • 모니터링되는 데이터베이스 수가 증가하면 변경사항 감지 시간이 늘어납니다.
  • ACL의 순 사용자 및 그룹 수가 증가하면 메모리 사용량이 증가합니다.
  • 커넥터는 하나의 Active Directory 도메인의 ID만 지원합니다.
  • 삭제 알림이 전파되는 데 4시간 이상 걸릴 수 있습니다.

시스템 요구사항

시스템 요구사항
운영체제 Windows Server 2016, Ubuntu, Red Hat Enterprise Linux 5.0 또는 SUSE Enterprise Linux 10 (64비트)
소프트웨어 SharePoint Server 2013 또는 2016, Java JRE 1.8
인증 NTLM, Kerberos, HTTP Basic 또는 ADFS

커넥터 배포

다음 단계에 따라 SharePoint 온프레미스 커넥터를 배포하세요.

기본 요건

  1. Google Workspace 비공개 키를 만듭니다. Cloud Search API에 대한 액세스 구성을 참고하세요.
  2. 검색할 데이터 소스를 추가하고 ID를 기록합니다. 검색할 데이터 소스 추가하기를 참고하세요.
  3. ACL 기반 결과를 사용하려면 관리자가 ID 소스 2개(Active Directory용 1개, SharePoint 로컬 그룹용 1개)를 만들고 Google Workspace 고객 ID를 제공해야 합니다. 사용자 ID 매핑을 참고하세요.
  4. 전체 읽기 권한이 있는 커넥터의 사용자 계정을 설정합니다.
  5. SharePoint 웹 애플리케이션에 루트 사이트 모음이 있는지 확인합니다.
  6. 사이트 모음이 쓰기 잠금 상태인 경우 PrepareWriteLockedSites.ps1 스크립트를 실행합니다.

1단계: 커넥터 소프트웨어 설치

  1. 저장소를 복제합니다.
    $ git clone https://github.com/google-cloudsearch/sharepoint-connector.git
    $ cd sharepoint-connector
  2. 선택한 버전을 체크아웃합니다 (예: v1-0.0.5):
    $ git checkout tags/v1-0.0.5
  3. 커넥터를 빌드합니다.
    $ mvn package
    테스트를 건너뛰려면 mvn package -DskipTests를 사용하세요.
  4. ZIP 파일을 설치 디렉터리에 압축 해제합니다.

2단계: 구성 파일 만들기

설치 디렉터리에 connector-config.properties을 만듭니다. 매개변수를 키-값 쌍으로 추가합니다.

api.sourceId=08ef8becd116faa4546b8ca2c84b2879
api.serviceAccountPrivateKeyFile=service_account.json
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
sharepoint.server=http://sp-2016:32967/sites/collection
sharepoint.siteCollectionOnly=true
sharepoint.username=contoso\\admin
sharepoint.password=password
adLookup.host=dc.contoso.com
adLookup.username=contoso\\admin
adLookup.password=password

자세한 내용은 참조 또는 Google 제공 매개변수를 참고하세요.

3단계: SharePoint를 신뢰할 수 있는 호스트로 추가 (HTTPS)

HTTPS를 사용하는 경우 SharePoint 인증서를 내보내고 커넥터의 키 저장소로 가져옵니다.

$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint

4단계: 로깅 설정

다음 콘텐츠로 logs 폴더와 logging.properties 파일을 만듭니다. properties handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler .level = INFO java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log

5단계: ID 커넥터 구성

ID 기반 ACL을 적용하려면 api.customerId 및 기타 연결 매개변수를 사용하여 sharepoint-onprem-identity-connector.config를 만듭니다.

6단계: 커넥터 실행

  1. GCDS를 실행하여 Active Directory 사용자 및 그룹을 동기화합니다.
  2. SharePoint ID 커넥터를 실행하여 사이트 모음 그룹을 동기화합니다.
  3. SharePoint 온프레미스 커넥터를 실행하여 콘텐츠를 색인 생성합니다.

구성 매개변수 참조 정보

다음 섹션에는 SharePoint 온프레미스 커넥터를 구성하는 데 사용되는 구성 매개변수가 나열되어 있습니다.

데이터 소스 액세스

설정 매개변수
데이터 소스 ID api.sourceId=ID
서비스 계정 api.serviceAccountPrivateKeyFile=path

SharePoint 온프레미스 액세스

설정 매개변수
서버 URL sharepoint.server=URL
사용자 인증 정보 sharepoint.usernamesharepoint.password

HTML 콘텐츠 생성

설정 매개변수
제목 필드 contentTemplate.sharePointItem.title=Title
품질 필드 contentTemplate.sharePointItem.quality.high, medium, low