شما میتوانید Google Cloud Search را طوری تنظیم کنید که علاوه بر محتوای Google Workspace شما، نتایجی از اشتراکگذاریهای Microsoft Windows سازمانتان را نیز برگرداند. شما از رابط Cloud Search File Systems استفاده میکنید و آن را برای دسترسی به اشتراکگذاریهای مشخصشدهی Windows پیکربندی میکنید. یک نمونه رابط میتواند از چندین اشتراکگذاری Microsoft Windows پشتیبانی کند.
ملاحظات مهم
قبل از استقرار رابط سیستمهای فایل، ملاحظات زیر را بررسی کنید.
بهروزرسانیهای خودکار مداوم
به طور پیشفرض، کانکتور هنگام راهاندازی، به طور مداوم مسیرهای شروع (مقادیر fs.src در فایل پیکربندی) را رصد میکند. هنگامی که سیستم فایل تغییرات در محتوا یا کنترلهای دسترسی را گزارش میدهد، کانکتور سیستم فایل را دوباره بررسی میکند. این بررسی مجدد میتواند منابع زیادی مصرف کند. برای خاموش کردن نظارت، fs.monitorForUpdates را روی false تنظیم کنید. این کار استفاده از منابع را کاهش میدهد اما زمانی که کانکتور تغییرات را منعکس میکند، تأخیر ایجاد میکند. اطلاعات بیشتر
کنترل دسترسی DFS
سیستم DFS کنترل دسترسی را روی لینکهای خود اعمال میکند و معمولاً هر لینک DFS دارای ACL مخصوص به خود است. DFS از شمارش مبتنی بر دسترسی (ABE) برای محدود کردن لینکهای بازگشتی به یک کاربر استفاده میکند. کاربران ممکن است فقط زیرمجموعهای از لینکهای DFS یا فقط یک لینک را در زمانی که ABE دایرکتوریهای خانگی را جدا میکند، ببینند. هنگام عبور از یک سیستم DFS، رابط به ACL لینک DFS و Share ACL هدف احترام میگذارد؛ Share ACL از DFS ACL به ارث میرسد.
محدودیتهای شناختهشده
این بخش محدودیتهای شناختهشدهی رابط سیستم فایل را فهرست میکند.
- سیستم فایل : این کانکتور از درایوهای نگاشتشده یا محلی پشتیبانی نمیکند.
- سیستم فایل توزیعشده : یک درایو نگاشتشده به یک سیستم فایل توزیعشدهی UNC به درستی کار نمیکند و برخی از ACLها ممکن است به درستی خوانده نشوند.
- این کانکتور از فضاهای نام و لینکهای DFS پشتیبانی میکند، اما پوشههای معمولی در فضای نام DFS را پشتیبانی نمیکند.
- لینکهای فایل در
cloudsearch.google.comیا لینکهای برگردانده شده توسط Query API در اکثر مرورگرها قابل کلیک نیستند.
الزامات سیستم
قبل از اینکه کانکتور File Systems را مستقر کنید، مطمئن شوید که دستگاه میزبان الزامات زیر را برآورده میکند:
| الزامات سیستم | |
|---|---|
| سیستم عامل |
|
| نرمافزار |
|
| پروتکلهای سیستم فایل |
پشتیبانی نمیشود: سیستم فایل محلی ویندوز، NFS 2.0، NFS 3.0 یا سیستم فایل محلی لینوکس. |
کانکتور را مستقر کنید
برای استقرار رابط سیستمهای فایل، این مراحل را دنبال کنید.
پیشنیازها
قبل از نصب کانکتور، مطمئن شوید که محیط شما این اجزا را دارد:
اطلاعات Google Workspace برای ایجاد ارتباط:
- کلید خصوصی Google Workspace (حاوی شناسه حساب سرویس). به پیکربندی دسترسی به Cloud Search API مراجعه کنید.
- شناسه منبع داده Google Workspace. به افزودن منبع داده برای جستجو مراجعه کنید.
- یک شناسه منبع هویت. به بخش ایجاد یک منبع هویت مراجعه کنید. اگر با Active Directory همگامسازی میکنید، از GCDS استفاده کنید.
سرپرست Google Workspace شما معمولاً میتواند این اعتبارنامهها را ارائه دهد.
مطمئن شوید که حساب کاربری ویندوز مجوزهای کافی را دارد.
مجوزهای لازم برای حساب کاربری مایکروسافت ویندوز
حساب کاربری ویندوز که رابط را اجرا میکند باید مجوزهای زیر را داشته باشد:
- فهرست کردن محتوای پوشه.
- محتوای سند را بخوانید.
- خواندن ویژگیهای فایل و پوشه
- مجوزهای خواندن (ACL) برای فایلها و پوشهها.
- ویژگیهای اساسی را بنویسید.
عضویت در یکی از این گروهها معمولاً مجوزهای کافی را اعطا میکند: مدیران، کاربران حرفهای، اپراتورهای چاپ یا اپراتورهای سرور.
مرحله 1. کانکتور را نصب کنید
مخزن کانکتور را از گیتهاب دانلود یا کلون کنید و سپس بسته کانکتور را بسازید.
مخزن کانکتور را از گیتهاب دریافت کنید و آن را بسازید.
برای استفاده از git در ویندوز سرور:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
برای دانلود مستقیم:
- به فایل windows-filesystems-connector بروید.
- روی کلون یا دانلود > دانلود فایل فشرده کلیک کنید.
- بسته را از حالت فشرده خارج کرده و به پوشه مورد نظر بروید.
اتصالدهنده را با استفاده از Apache Maven بسازید:
برای رد کردن تستها، از> mvn package
mvn package -DskipTestsاستفاده کنید.فایل زیپ کانکتور را در پوشه نصب خود استخراج کنید:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
مرحله ۲. ایجاد فایل پیکربندی
پس از نصب کانکتور، یک فایل پیکربندی ایجاد کنید که شامل تنظیمات مربوط به کانکتور باشد.
- در دایرکتوری کانکتور، فایلی با نام
connector-config.propertiesایجاد کنید. پارامترها را به صورت جفتهای کلید-مقدار اضافه کنید. برای مثال:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDبرای پارامترهای خاص سیستم فایل، به مرجع پارامترهای پیکربندی مراجعه کنید. برای فهرستی از پارامترهای رایج مورد استفاده توسط همه رابطهای جستجوی ابری، به پارامترهای رابط ارائه شده توسط گوگل مراجعه کنید.
مرحله ۳. فعال کردن ثبت وقایع
یک دایرکتوری برای گزارشها ایجاد کنید و یک فایل پیکربندی گزارشگیری نیز بسازید.
- یک پوشه با نام
logsدر دایرکتوری کانکتور ایجاد کنید. فایلی با نام
logging.propertiesبا محتوای زیر ایجاد کنید:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
مرحله ۴. (اختیاری) پیکربندی انواع رسانه
این رابط سعی میکند انواع رسانههای فایل را با استفاده از مکانیسم پیشفرض خود که در ویندوز به ورودیهای رجیستری متکی است، شناسایی کند. اگر ورودی رجیستری برای یک پسوند فایل وجود نداشته باشد، رابط ممکن است نتواند نوع رسانه را به درستی تشخیص دهد. اگر انواع رسانهها به درستی شناسایی نشوند، یا اگر میخواهید نوع پیشفرض یک پسوند را نادیده بگیرید، این مراحل را دنبال کنید:
- فایلی با نام
mime-type.propertiesدر دایرکتوری کانکتور ایجاد کنید. - پسوندها و انواع را به صورت
extension=media/typeوارد کنید:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
مرحله ۵. رابط سیستمهای فایل را اجرا کنید
کانکتور را از دستگاه میزبان اجرا کنید:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config] به طور پیشفرض، کانکتور به دنبال یک فایل پیکربندی با نام connector-config.properties در دایرکتوری که کانکتور در آن اجرا میشود، میگردد. اگر فایل پیکربندی شما نام دیگری دارد یا در دایرکتوری دیگری است، از پارامتر -Dconfig برای مشخص کردن مسیر آن استفاده کنید.
مرجع پارامترهای پیکربندی
جداول زیر پارامترهای مورد استفاده برای پیکربندی رابط سیستمهای فایل را فهرست و شرح میدهند.
دسترسی به منبع داده
| تنظیم | پارامتر |
| شناسه منبع داده | api.sourceId= 1234567890abcdefالزامی. شناسه منبع جستجوی ابری. |
| حساب کاربری خدمات | api.serviceAccountPrivateKeyFile= ./PrivateKey.jsonالزامی. مسیر فایل کلید حساب سرویس. |
| شناسه منبع هویت | api.identitySourceId= x0987654321الزامی. شناسه منبع هویت جستجوی ابری که توسط مدیر Google Workspace برای همگامسازی هویتهای دایرکتوری فعال با استفاده از GCDS تنظیم شده است. |
دسترسی به سیستم فایل
از این پارامترها برای مشخص کردن منابع سیستم فایل برای خزش استفاده کنید.
| تنظیم | پارامتر |
| سیستمهای فایل منبع | fs.src= path1 [, path2 , ...] الزامی. سیستمهای فایل منبع را به عنوان یک یا چند منبع UNC مشخص کنید که توسط جداکننده پیکربندی شده توسط |
کاراکتر جداکننده مسیر
| تنظیم | پارامتر |
| کاراکتر جداکننده مسیر | fs.src.separator= separator-characterجداکننده پیشفرض ";" است. اگر مسیرهای منبع شما حاوی نقطه ویرگول باشند، میتوانید جداکننده متفاوتی مانند کاما (",") تنظیم کنید که با کاراکترهای مسیرهای شما تداخل نداشته باشد و توسط خود سینتکس فایل ویژگی رزرو نشده باشد. اگر مقدار |
رفتار کانکتور
از این پارامترها برای تنظیم نحوهی خزش کانکتور در سیستمهای فایل استفاده کنید.
| تنظیم | پارامتر |
| دامنه ویندوز | fs.supportedDomain= domainبرای دسترسی کاربرانی که GCDS را تنظیم کردهاند به اسناد از طریق جستجوی ابری لازم است. به عنوان یک نام دامنه NetBIOS واحد از Active Directory مشخص کنید. |
| حسابها را در ACLS بگنجانید | fs.supportedAccounts= account-1[, account-2,...]فهرستی از حسابها که با کاما از هم جدا شدهاند تا در ACLها لحاظ شوند، صرف نظر از اینکه حسابهای داخلی باشند یا خیر. مقدار پیشفرض عبارت است از |
| حسابهای داخلی را از ACLها مستثنی کنید | fs.builtinGroupPrefix= prefixپیشوند حسابهای داخلی را مشخص کنید. حسابی که با این پیشوند شروع شود، یک حساب داخلی محسوب میشود و از ACLها حذف خواهد شد. مقدار پیشفرض |
| اجازه دهید فایلها و پوشههای مخفی ایندکس شوند | fs.crawlHiddenFiles= boolean برای خزش فایلهای مخفی، روی |
| امکان ایندکس کردن فهرست پوشههای پیمایششده و شمارشهای فضای نام DFS | fs.indexFolders= boolean وقتی روی |
| فعال کردن نظارت بر تغییر سیستم فایل | fs.monitorForUpdates= boolean وقتی روی |
| حداکثر اندازه حافظه پنهان دایرکتوریها را تنظیم کنید | fs.directoryCacheSize= number-of-entriesحداکثر اندازه حافظه پنهان دایرکتوری. رابط از حافظه پنهان برای شناسایی پوشههای مخفی استفاده میکند تا از فهرستبندی فایلها و پوشهها در پوشههای مخفی جلوگیری کند. مقدار پیشفرض ۵۰،۰۰۰ ورودی است که معمولاً ۱۰ تا ۱۵ مگابایت از رم را اشغال میکنند. |
حفظ مهر زمانی
از این پارامترها برای مشخص کردن نحوه مدیریت حفظ مهر زمانی توسط کانکتور استفاده کنید.
| تنظیم | پارامتر |
| زمان دسترسی را حفظ کنید | fs.preserveLastAccessTime= valueهنگام خزش فایلها و پوشهها، رابط میتواند آخرین زمان دسترسی آنها را به زمان خزش تغییر دهد. اگر آخرین زمانهای دسترسی حفظ نشوند، سیستمهای پشتیبانگیری و بایگانی ممکن است فایلها و پوشههای مناسب را به حافظه ثانویه منتقل نکنند زیرا رابط به آنها دسترسی داشته است. به طور پیشفرض، مقادیر ممکن عبارتند از:
|
| فقط فایلهایی را که پس از یک تاریخ مشخص به آنها دسترسی پیدا شده است، خزش کنید | fs.lastAccessedDate= YYYY-MM-DD فقط در صورتی که آخرین زمان دسترسی بعد از تاریخ مشخص شده (YYYY-MM-DD، فرمت ISO8601 ) باشد، محتوا را بررسی میکند. پیشفرض |
| فقط فایلهایی را که در چند روز گذشته به آنها دسترسی پیدا شده است، خزش کنید | fs.lastAccessedDays= number-of-days فقط در صورتی که آخرین زمان دسترسی در بازه زمانی مشخص شده از زمان حال باشد، محتوا را بررسی میکند. پیشفرض |
| فقط فایلهایی را که پس از یک تاریخ مشخص تغییر یافتهاند، خزش کنید | fs.lastModifiedDate= YYYY-MM-DD فقط در صورتی که آخرین زمان تغییر پس از تاریخ مشخص شده (YYYY-MM-DD، فرمت ISO8601 ) باشد، محتوا را بررسی میکند. پیشفرض |
| فقط فایلهایی را که در چند روز گذشته تغییر یافتهاند، خزش کنید | fs.lastModifiedDays= number-of-days فقط در صورتی که آخرین زمان اصلاح، در تعداد روزهای مشخص شده از زمان حال باشد، محتوا را بررسی میکند. پیشفرض |
نادیده گرفتن ACL های اشتراک گذاری فایل
شما میتوانید کانکتور را طوری تنظیم کنید که اگر مجوزهای خواندن ACLهای اشتراکی را ندارد، آنها را نادیده بگیرد. سپس محتوا با یک ACL اشتراکی مجاز بازگردانده میشود.
| تنظیم | پارامتر |
| نادیده گرفتن ACL های اشتراک گذاری | fs.skipShareAccessControl= boolean برای نادیده گرفتن ACL های اشتراکی، روی |