توليف الإعدادات

تتضمّن حزمة تطوير البرامج (SDK) في Google Cloud Search مَعلمات إعداد مقدَّمة من Google لجميع الموصِّلات. يمكن أن يؤدي ضبط هذه الإعدادات إلى تبسيط عملية فهرسة البيانات. يسرد هذا الدليل مشاكل الفهرسة الشائعة والإعدادات اللازمة لحلّها.

معدّل فهرسة منخفض لبرنامج FullTraversalConnector

يسرد الجدول التالي الإعدادات التي يمكن استخدامها لتحسين سرعة معالجة البيانات في FullTraversalConnector:

الإعداد الوصف تلقائي التغيير المقترَح
traverse.partitionSize عدد عناصر ApiOperation() التي تتم معالجتها على دفعات ينتظر حزمة تطوير البرامج (SDK) اكتمال أحد الأقسام قبل جلب المزيد. 50 يمكنك زيادة الحدّ إلى 1,000 أو أكثر إذا كانت لديك ذاكرة كافية.
batch.batchSize عدد الطلبات المجمّعة معًا 10 جرِّب تقليل حجم الدفعة.
batch.maxActiveBatches عدد الدفعات المتزامنة المسموح بها 20 إذا خفّضت batchSize، يمكنك زيادة هذا الحد باستخدام: (partitionSize / batchSize) + 50.
traverse.threadPoolSize عدد سلاسل المحادثات للمعالجة المتوازية 50 يمكنك زيادة هذا الرقم بمضاعفات العدد 10.

ننصحك باستخدام setRequestMode() للتبديل بين وضعَي طلبات البيانات من واجهة برمجة التطبيقات ASYNCHRONOUS وSYNCHRONOUS.

انخفاض معدّل نقل البيانات عند الفهرسة في ListTraversalConnector

يستخدم ListTraversalConnector أداة اجتياز واحدة تلقائيًا. لزيادة سرعة معالجة البيانات، أنشئ أدوات مسح متعددة لحالات عناصر معيّنة (مثل NEW_ITEM وMODIFIED).

الإعدادالوصفتلقائيتغيير
repository.traversersتنشئ هذه السمة أدوات زحف فردية بأسماء فريدة (مثل t1, t2).One traverserإضافة المزيد من أدوات التجوال
traversers.t1.hostloadعدد سلاسل المحادثات التي ستتم فهرسة العناصر بها بشكل متزامن.5جرِّب قيمًا تبلغ 10 أو أكثر.
schedule.pollQueueIntervalSecsعدد الثواني التي يجب الانتظار خلالها قبل إعادة طلب بيانات من قائمة انتظار فارغة.10جرِّب تخفيضها إلى 1.
traverser.t1.pollRequest.statusesالحالات التي سيتم فهرستها (مثلاً، NEW_ITEM).الكلّاستخدِم أدوات زحف مختلفة للحالات المختلفة.

انتهاء المهلة أو الانقطاعات في حزمة تطوير البرامج (SDK)

إذا حدثت مهلات عند تحميل ملفات كبيرة، يمكنك زيادة المهلة باستخدام traverser.timeout=seconds (القيمة التلقائية هي 60 ثانية). يمكنك أيضًا زيادة مهلات طلبات واجهة برمجة التطبيقات:

المَعلمة الوصف تلقائي
indexingService.connectTimeoutSeconds مهلة الاتصال لطلبات البيانات من واجهة برمجة التطبيقات ‫120 ثانية
indexingService.readTimeoutSeconds مهلة القراءة لطلبات البيانات من واجهة برمجة التطبيقات ‫120 ثانية