গুগল ক্লাউড সার্চ এসডিকে সমস্ত সংযোগকারীর জন্য গুগল-সরবরাহকৃত কনফিগারেশন প্যারামিটার অন্তর্ভুক্ত করে। এই সেটিংস টিউন করলে ডেটা ইন্ডেক্সিং সহজতর হতে পারে। এই নির্দেশিকাটিতে সাধারণ ইন্ডেক্সিং সমস্যা এবং সেগুলি সমাধানের জন্য সেটিংস তালিকাভুক্ত করা হয়েছে।
FullTraversalConnector-এর জন্য কম ইনডেক্সিং থ্রুপুট
নিম্নলিখিত টেবিলে একটি FullTraversalConnector এর থ্রুপুট উন্নত করার জন্য সেটিংস তালিকাভুক্ত করা হয়েছে:
| বিন্যাস | বিবরণ | ডিফল্ট | প্রস্তাবিত পরিবর্তন |
|---|---|---|---|
traverse.partitionSize | ব্যাচে প্রক্রিয়াজাত ApiOperation() আইটেমের সংখ্যা। SDK আরও আনার আগে একটি পার্টিশন সম্পূর্ণ হওয়ার জন্য অপেক্ষা করে। | ৫০ | আপনার পর্যাপ্ত মেমোরি থাকলে ১০০০ বা তার বেশি করে বাড়ান। |
batch.batchSize | একসাথে ব্যাচ করা অনুরোধের সংখ্যা। | ১০ | ব্যাচের আকার কমানোর চেষ্টা করুন। |
batch.maxActiveBatches | অনুমোদিত সমসাময়িক ব্যাচ। | ২০ | যদি আপনি batchSize কম করেন, তাহলে এটি ব্যবহার করে বাড়ান: (partitionSize / batchSize) + 50 । |
traverse.threadPoolSize | সমান্তরাল প্রক্রিয়াকরণের জন্য থ্রেডের সংখ্যা। | ৫০ | এটিকে ১০ এর গুণিতক দিয়ে বাড়াও। |
ASYNCHRONOUS এবং SYNCHRONOUS API অনুরোধ মোডের মধ্যে স্যুইচ করতে setRequestMode() ব্যবহার করার কথা বিবেচনা করুন।
ListTraversalConnector-এর জন্য কম ইনডেক্সিং থ্রুপুট
একটি ListTraversalConnector ডিফল্টরূপে একটি ট্র্যাভারসার ব্যবহার করে। থ্রুপুট বাড়ানোর জন্য, নির্দিষ্ট আইটেম স্ট্যাটাসের জন্য একাধিক ট্র্যাভারসার তৈরি করুন (যেমন, NEW_ITEM , MODIFIED )।
| বিন্যাস | বিবরণ | ডিফল্ট | পরিবর্তন |
|---|---|---|---|
repository.traversers | অনন্য নামের (যেমন, t1, t2 ) পৃথক ট্র্যাভারসার তৈরি করে। | একজন ট্রাভার্সার | আরও ট্র্যাভারসার যোগ করুন। |
traversers. t1 .hostload | আইটেমগুলিকে একযোগে সূচী করার জন্য থ্রেডের সংখ্যা। | ৫ | ১০ বা তার বেশি মান চেষ্টা করুন। |
schedule.pollQueueIntervalSecs | খালি সারি পুনঃভোট দেওয়ার আগে কয়েক সেকেন্ড অপেক্ষা করতে হবে। | ১০ | ১ এ নামিয়ে চেষ্টা করুন। |
traverser. t1 .pollRequest.statuses | সূচীতে স্ট্যাটাস (যেমন, NEW_ITEM )। | সব | বিভিন্ন স্ট্যাটাসের জন্য বিভিন্ন ট্র্যাভার্সার ব্যবহার করুন। |
SDK টাইমআউট বা ইন্টারাপ্ট
যদি বড় ফাইল আপলোড করার সময় টাইমআউট হয়, তাহলে traverser.timeout= seconds ব্যবহার করে টাইমআউট বাড়ান (ডিফল্ট ৬০ সেকেন্ড)। আপনি API অনুরোধের টাইমআউটও বাড়াতে পারেন:
| প্যারামিটার | বিবরণ | ডিফল্ট |
|---|---|---|
indexingService.connectTimeoutSeconds | API অনুরোধের জন্য সংযোগের সময়সীমা শেষ। | ১২০ এর দশক |
indexingService.readTimeoutSeconds | API অনুরোধের জন্য পড়ার সময়সীমা শেষ। | ১২০ এর দশক |