Google-এর দেওয়া কনফিগারেশন প্যারামিটার

প্রতিটি সংযোগকারীর একটি সংযুক্ত কনফিগারেশন ফাইল থাকে যাতে সংযোগকারীর দ্বারা ব্যবহৃত পরামিতি থাকে, যেমন আপনার সংগ্রহস্থলের জন্য আইডি। পরামিতিগুলিকে কী-মানের জোড়া হিসাবে সংজ্ঞায়িত করা হয়, যেমন api.sourceId=1234567890abcdef

Google ক্লাউড অনুসন্ধান SDK-এ বিভিন্ন সংযোগকারীর দ্বারা ব্যবহৃত Google-এর সরবরাহকৃত কনফিগারেশন প্যারামিটার রয়েছে৷ Google-এর দেওয়া কনফিগারেশন প্যারামিটারগুলির মধ্যে, শুধুমাত্র ডেটা সোর্স অ্যাক্সেস প্যারামিটারগুলি আপনার কনফিগারেশন ফাইলে সংজ্ঞায়িত করা প্রয়োজন৷ আপনার কনফিগারেশন ফাইলে Google-এর সরবরাহকৃত প্যারামিটারগুলিকে পুনরায় সংজ্ঞায়িত করার প্রয়োজন নেই যদি না আপনি তাদের ডিফল্ট মানগুলিকে ওভাররাইড করতে চান৷

এই রেফারেন্সটি Google দ্বারা সরবরাহ করা কনফিগারেশন পরামিতি বর্ণনা করে।

কনফিগারেশন ফাইলের উদাহরণ

নিম্নলিখিত উদাহরণটি প্যারামিটার কী-মান জোড়া সহ একটি পরিচয় কনফিগারেশন ফাইল দেখায়।

#
# Configuration file sample
#
api.sourceId=1234567890abcdef
api.identitySourceId=0987654321lmnopq
api.serviceAccountPrivateKeyFile= ./PrivateKey.json

#
# Traversal schedules
#
schedule.traversalIntervalSecs=7200
schedule.incrementalTraversalIntervalSecs=600
#
# Default ACLs
#
defaultAcl.mode=fallback
defaultAcl.public=true
  

সাধারণত সেট প্যারামিটার

এই বিভাগে প্রয়োজনীয় এবং ঐচ্ছিক সাধারণভাবে সেট করা কনফিগারেশন পরামিতি তালিকাভুক্ত করা হয়েছে। আপনি ঐচ্ছিক পরামিতিগুলির জন্য মান পরিবর্তন না করলে, সংযোগকারী SDK দ্বারা প্রদত্ত ডিফল্ট মানগুলি ব্যবহার করে৷

ডেটা উত্স অ্যাক্সেস

নিম্নলিখিত সারণীতে একটি কনফিগারেশন ফাইলে উপস্থিত হওয়ার জন্য প্রয়োজনীয় সমস্ত প্যারামিটারের তালিকা রয়েছে। আপনি যে প্যারামিটারগুলি ব্যবহার করেন তা নির্ভর করে আপনি যে ধরনের সংযোগকারী তৈরি করছেন (কন্টেন্ট সংযোগকারী বা পরিচয় সংযোগকারী) তার উপর।

বিন্যাস প্যারামিটার
ডেটা সোর্স আইডি api.sourceId = 1234567890abcdef

এই প্যারামিটারটি আপনার সংগ্রহস্থলের অবস্থান সনাক্ত করতে একটি সংযোগকারীর দ্বারা প্রয়োজন৷ আপনি যখন অনুসন্ধানের জন্য একটি ডেটা উৎস যোগ করেন তখন আপনি এই মানটি পান। এই প্যারামিটারটি অবশ্যই সংযোগকারী কনফিগারেশন ফাইলগুলিতে থাকতে হবে।

পরিচয় উৎস আইডি api.identitySourceId = 0987654321lmnopq

এই প্যারামিটারটি একটি বাহ্যিক পরিচয় উৎসের অবস্থান শনাক্ত করতে পরিচয় সংযোগকারীর দ্বারা প্রয়োজন৷ আপনি যখন ক্লাউড অনুসন্ধানে ব্যবহারকারীর পরিচয় ম্যাপ করেন তখন আপনি এই মানটি পেয়েছেন৷ এই প্যারামিটারটি অবশ্যই সমস্ত পরিচয় সংযোগকারী কনফিগারেশন ফাইলে থাকতে হবে।

পরিষেবা অ্যাকাউন্ট ব্যক্তিগত কী ফাইল api.serviceAccountPrivateKeyFile =./PrivateKey.json

এই প্যারামিটারে রিপোজিটরি অ্যাক্সেস করার জন্য প্রয়োজনীয় ব্যক্তিগত কী রয়েছে। আপনি Google ক্লাউড অনুসন্ধান REST API-তে অ্যাক্সেস কনফিগার করার সময় এই মানটি পেয়েছেন। এই প্যারামিটারটি অবশ্যই সমস্ত কনফিগারেশন ফাইলে থাকতে হবে।

পরিষেবা অ্যাকাউন্ট আইডি api.serviceAccountId = 123abcdef4567890

এই পরামিতি পরিষেবা অ্যাকাউন্ট আইডি নির্দিষ্ট করে। ডিফল্ট খালি স্ট্রিং মান শুধুমাত্র তখনই অনুমোদনযোগ্য যখন কনফিগারেশন ফাইল একটি ব্যক্তিগত কী ফাইল প্যারামিটার নির্দিষ্ট করে। আপনার ব্যক্তিগত কী ফাইলটি JSON কী না হলে এই প্যারামিটারটি প্রয়োজন৷

Google Workspace অ্যাকাউন্ট আইডি api.customerId = 123abcdef4567890

এই প্যারামিটারটি এন্টারপ্রাইজের Google Workspace অ্যাকাউন্টের জন্য অ্যাকাউন্ট আইডি নির্দিষ্ট করে। আপনি যখন ক্লাউড অনুসন্ধানে ব্যবহারকারীর পরিচয় ম্যাপ করেন তখন আপনি এই মানটি পেয়েছেন৷ একটি পরিচয় সংযোগকারী ব্যবহার করে ব্যবহারকারীদের সিঙ্ক করার সময় এই প্যারামিটারটি প্রয়োজন৷

রুট URL api.rootUrl = baseURLPath

এই প্যারামিটারটি ইন্ডেক্সিং পরিষেবা বেস URL পাথ নির্দিষ্ট করে৷

এই প্যারামিটারের জন্য ডিফল্ট মান হল একটি খালি স্ট্রিং যা https://cloudsearch.googleapis.com এ রূপান্তরিত হয়।

ট্রাভার্সাল সময়সূচী

সময়সূচী পরামিতি নির্ধারণ করে কত ঘন ঘন সংযোগকারী ট্রাভার্সালের মধ্যে অপেক্ষা করে।

বিন্যাস প্যারামিটার
সংযোগকারী স্টার্টআপে সম্পূর্ণ ট্রাভার্সাল schedule.performTraversalOnStart = true|false

প্রথম ব্যবধানের মেয়াদ শেষ হওয়ার জন্য অপেক্ষা না করে সংযোগকারীটি সংযোগকারী স্টার্টআপে একটি সম্পূর্ণ ট্রাভার্সাল সম্পাদন করে। প্রচলিত মূল্য true.

একটি ব্যবধানের পর সম্পূর্ণ ট্রাভার্সাল schedule.traversalIntervalSecs = intervalInSeconds

সংযোগকারী একটি নির্দিষ্ট ব্যবধানের পরে একটি সম্পূর্ণ ট্রাভার্সাল সঞ্চালন করে। সেকেন্ডে ট্রাভার্সালের মধ্যে ব্যবধান নির্দিষ্ট করুন। ডিফল্ট মান হল 86400 (এক দিনে সেকেন্ডের সংখ্যা)।

একটি একক ট্রাভার্সাল পরে প্রস্থান করুন connector.runOnce = true|false

সংযোগকারী একবার সম্পূর্ণ ট্রাভার্সাল চালায়, তারপর প্রস্থান করে। এই প্যারামিটারটি শুধুমাত্র true হিসাবে সেট করা উচিত যদি আপনি একটি সম্পূর্ণ ট্রাভার্সাল কৌশল ব্যবহার করেন; তালিকা এবং গ্রাফ কৌশল পরিবর্তন এবং সূচক বিষয়বস্তু সনাক্ত করতে একাধিক ট্রাভার্সাল প্রয়োজন. ডিফল্ট মান false (একক ট্রাভার্সালের পরে প্রস্থান করবেন না)।

একটি বিরতির পরে ক্রমবর্ধমান ট্রাভার্সাল schedule.incrementalTraversalIntervalSecs = intervalInSeconds

সংযোগকারী একটি নির্দিষ্ট ব্যবধানের পরে একটি ক্রমবর্ধমান ট্রাভার্সাল সঞ্চালন করে। সেকেন্ডে ট্রাভার্সালের মধ্যে ব্যবধান নির্দিষ্ট করুন। ডিফল্ট মান হল 300 (5 মিনিটে সেকেন্ডের সংখ্যা)।

নির্ধারিত পোল সারি ব্যবধান schedule.pollQueueIntervalSecs = interval_in_seconds

নির্ধারিত পোল কিউ ব্যবধানের মধ্যে ব্যবধান (সেকেন্ডে)। এটি শুধুমাত্র একটি তালিকা ট্রাভার্সাল সংযোগকারী দ্বারা ব্যবহৃত হয়। ডিফল্ট মান হল 10.

অ্যাক্সেস নিয়ন্ত্রণ তালিকা

সংযোগকারী ACL ব্যবহার করে আইটেমগুলিতে অ্যাক্সেস নিয়ন্ত্রণ করে। একাধিক পরামিতি আপনাকে ACL এর সাথে সূচীকৃত রেকর্ডগুলিতে ব্যবহারকারীর অ্যাক্সেস রক্ষা করতে দেয়।

আপনার সংগ্রহস্থলে প্রতিটি আইটেমের সাথে যুক্ত পৃথক ACL তথ্য থাকলে, ক্লাউড অনুসন্ধানের মধ্যে আইটেম অ্যাক্সেস নিয়ন্ত্রণ করতে সমস্ত ACL তথ্য আপলোড করুন। যদি আপনার সংগ্রহস্থল আংশিক বা কোন ACL তথ্য প্রদান করে, আপনি নিম্নলিখিত পরামিতিতে ডিফল্ট ACL তথ্য সরবরাহ করতে পারেন, যা SDK সংযোগকারীকে প্রদান করে।

বিন্যাস প্যারামিটার
ACL মোড defaultAcl.mode = mode

ডিফল্ট ACL কখন প্রয়োগ করতে হবে তা নির্ধারণ করে। বৈধ মান:

  • none : ডিফল্ট ACL ব্যবহার করবেন না (এই মোডে, আপনি পৃথক ACLs সংজ্ঞায়িত না করলে রেকর্ডগুলি অনুসন্ধানযোগ্য নয়)
  • fallback : ডিফল্ট ACL ব্যবহার করুন যদি কোনো ACL ইতিমধ্যে উপস্থিত না থাকে
  • append : বিদ্যমান ACL-তে ডিফল্ট ACL যোগ করুন
  • override : বিদ্যমান ACL কে ডিফল্ট ACL দিয়ে প্রতিস্থাপন করুন

ডিফল্ট মোড none

ডিফল্ট পাবলিক ACL defaultAcl.public = true|false

সম্পূর্ণ সংগ্রহস্থলের জন্য ব্যবহৃত ডিফল্ট ACL পাবলিক ডোমেন অ্যাক্সেসে সেট করা আছে। ডিফল্ট মান false.

সাধারণ ACL গ্রুপ পাঠক defaultAcl.readers.groups = google: group1@mydomain.com, group2
সাধারণ ACL পাঠক defaultAcl.readers.users = user1, user2, google: user3@mydomain.com
সাধারণ ACL গ্রুপ পাঠকদের অস্বীকার করেছে defaultAcl.denied.groups = group3
সাধারণ ACL পাঠকদের অস্বীকার করেছে defaultAcl.denied.users = user4, user5
সম্পূর্ণ ডোমেইন অ্যাক্সেস ডোমেনের প্রতিটি ব্যবহারকারীর দ্বারা প্রতিটি সূচীকৃত রেকর্ড সর্বজনীনভাবে অ্যাক্সেসযোগ্য হবে তা নির্দিষ্ট করতে, মান সহ নিম্নলিখিত উভয় প্যারামিটার সেট করুন:
  • defaultAcl.mode =override
  • defaultACL.public =true
সাধারণ সংজ্ঞায়িত ACL ডেটা সংগ্রহস্থলের প্রতিটি রেকর্ডের জন্য একটি ACL নির্দিষ্ট করতে, নিম্নলিখিত সমস্ত প্যারামিটার মান সেট করুন:
  • defaultAcl.mode =fallback
  • defaultAcl.public =false
  • defaultAcl.readers.groups = google :group1@mydomain.com, group2 কোড>
  • defaultAcl.readers.users = user1@mydomain.com, user2, google: user3@mydomain.com
  • defaultAcl.denied.groups = group3
  • defaultAcl.denied.users = user4, user5

    প্রতিটি নির্দিষ্ট ব্যবহারকারী এবং গোষ্ঠীকে একটি স্থানীয় ডোমেন সংজ্ঞায়িত ব্যবহারকারী/গোষ্ঠী বলে ধরে নেওয়া হয় যদি না " google: " (আক্ষরিক ধ্রুবক) এর সাথে প্রিফিক্স করা হয়।

    ডিফল্ট ব্যবহারকারী বা গোষ্ঠী একটি খালি স্ট্রিং। defaultAcl.public false সেট করা থাকলে শুধুমাত্র ব্যবহারকারী এবং গোষ্ঠীর পরামিতি সরবরাহ করুন। একাধিক গোষ্ঠী এবং ব্যবহারকারীদের তালিকা করতে, কমা-ডিলিমিটেড তালিকা ব্যবহার করুন।

    যদি defaultAcl.mode none তে সেট করা থাকে, তবে নির্দিষ্ট পৃথক ACL ব্যতীত রেকর্ডগুলি অনুসন্ধানযোগ্য নয়৷

মেটাডেটা কনফিগারেশন পরামিতি

কিছু আইটেম মেটাডেটা কনফিগারযোগ্য। সংযোগকারীরা সূচীকরণের সময় কনফিগারযোগ্য মেটাডেটা ক্ষেত্র সেট করতে পারে। যদি সংযোগকারী একটি ক্ষেত্র সেট না করে, আপনার কনফিগারেশন ফাইলের পরামিতিগুলি ক্ষেত্র সেট করতে ব্যবহৃত হয়।

কনফিগারেশন ফাইলের নামযুক্ত মেটাডেটা কনফিগারেশন প্যারামিটারের একটি সিরিজ রয়েছে যা একটি .field প্রত্যয় দ্বারা নির্দেশিত, যেমন itemMetadata.title.field= movieTitle । এই পরামিতিগুলির জন্য একটি মান থাকলে, এটি মেটাডেটা ক্ষেত্র কনফিগার করতে ব্যবহৃত হয়। নামযুক্ত মেটাডেটা প্যারামিটারের জন্য কোন মান না থাকলে, মেটাডেটা .defaultValue প্রত্যয় সহ একটি প্যারামিটার ব্যবহার করে কনফিগার করা হয়।

নিম্নলিখিত টেবিল মেটাডেটা কনফিগারেশন পরামিতি দেখায়.

বিন্যাস প্যারামিটার
শিরোনাম itemMetadata.title.field= movieTitle
itemMetadata.title.defaultValue= Gone with the Wind
আইটেম শিরোনাম. যদি title.field একটি মান সেট না করা হয়, তাহলে title.defaultValue এর মান ব্যবহার করা হয়।
উৎস সংগ্রহস্থল URL itemMetadata.sourceRepositoryUrl.field= url
itemMetadata.sourceRepositoryUrl.defaultValue=https://www.imdb.com/title/tt0031381/
অনুসন্ধান ফলাফলে ব্যবহৃত আইটেম URL. আপনি সম্পূর্ণ রিপোজিটরির জন্য একটি URL ধরে রাখতে defaultValue সেট করতে পারেন, যেমন আপনার রিপোজিটরি একটি CSV ফাইল এবং প্রতিটি আইটেমের জন্য শুধুমাত্র একটি URL আছে। sourceRepositoryUrl.field একটি মান সেট করা না থাকলে, sourceRepositoryUrl.defaultValue এর মান ব্যবহার করা হয়।
ধারক নাম itemMetadata.containerName.field= containerName
itemMetadata.containerName.defaultValue=myDefaultContainerName
আইটেমের ধারকটির নাম, যেমন একটি ফাইল সিস্টেম ডিরেক্টরি বা ফোল্ডারের নাম। containerName.field একটি মান সেট না করা থাকলে, containerName.defaultValue এর মান ব্যবহার করা হয়।
বস্তুর ধরন itemMetadata.objectType.field= type
itemMetadata.objectType.defaultValue= movie
সংযোগকারী দ্বারা ব্যবহৃত বস্তুর ধরন, স্কিমাতে সংজ্ঞায়িত করা হয়েছে। এই প্রপার্টি নির্দিষ্ট না হলে সংযোগকারী কোনো স্ট্রাকচার্ড ডেটা ইন্ডেক্স করবে না।
যদি objectType.field একটি মান সেট করা না থাকে, তাহলে objectType.defaultValue এর মান ব্যবহার করা হয়।
সময় তৈরি করুন itemMetadata.createTime.field= releaseDate
itemMetadata.createTime.defaultValue=1940-01-17
নথি তৈরির টাইমস্ট্যাম্প। যদি createTime.field একটি মান সেট করা না থাকে, তাহলে createTime.defaultValue এর মান ব্যবহার করা হয়।
আপডেটের সময় itemMetadata.updateTime.field= releaseDate
itemMetadata.updateTime.defaultValue=1940-01-17
আইটেমের জন্য শেষ পরিবর্তন টাইমস্ট্যাম্প। যদি updateTime.field একটি মান সেট না করা হয়, updateTime.defaultValue এর মান ব্যবহার করা হয়।
বিষয়বস্তুর ভাষা itemMetadata.contentLanguage.field= languageCode
itemMetadata.contentLanguage.defaultValue= en-US
সূচীকৃত নথিগুলির জন্য বিষয়বস্তুর ভাষা। contentLanguage.field একটি মান সেট করা না থাকলে, contentLanguage.defaultValue এর মান ব্যবহার করা হয়।
MIME ধরণ itemMetadata.mimeType.field= mimeType
itemMetadata.mimeType.defaultValue= image/bmp
উৎস সংগ্রহস্থলে ItemContent.content-এর আসল মাইম-টাইপ। সর্বাধিক দৈর্ঘ্য 256 অক্ষর। mimeType.field একটি মান সেট না থাকলে, mimeType.defaultValue এর মান ব্যবহার করা হয়।
মানের মেটাডেটা অনুসন্ধান করুন itemMetadata.searchQualityMetadata.quality.field= quality
itemMetadata.searchQualityMetadata.quality.defaultValue= 1
আইটেমের গুণমানের একটি ইঙ্গিত, অনুসন্ধানের গুণমানকে প্রভাবিত করতে ব্যবহৃত। মান 0.0 (সর্বনিম্ন গুণমান) এবং 1.0 (সর্বোচ্চ গুণমান) এর মধ্যে হওয়া উচিত। ডিফল্ট মান হল 0.0। যদি quality.field একটি মান সেট করা না থাকে, তাহলে quality.defaultValue এর মান ব্যবহার করা হয়।
হ্যাশ itemMetadata.hash.field= hash
itemMetadata.hash.defaultValue=f0fda58630310a6dd91a7d8f0a4ceda2
API কলার দ্বারা প্রদত্ত হ্যাশিং মান। এটি পরিবর্তিত অবস্থা গণনা করতে items.push পদ্ধতির সাথে ব্যবহার করা যেতে পারে। সর্বাধিক দৈর্ঘ্য 2048 অক্ষর। যদি hash.field একটি মান সেট না করা হয়, hash.defaultValue এর মান ব্যবহার করা হয়।

তারিখ সময় বিন্যাস

ডেটটাইম ফর্ম্যাটগুলি মেটাডেটা বৈশিষ্ট্যগুলিতে প্রত্যাশিত ফর্ম্যাটগুলি নির্দিষ্ট করে৷ কনফিগারেশন ফাইলে এই প্যারামিটার না থাকলে, ডিফল্ট মান ব্যবহার করা হয়। নিম্নলিখিত টেবিল এই পরামিতি দেখায়.

বিন্যাস প্যারামিটার
অতিরিক্ত তারিখ সময় বিন্যাস structuredData.dateTimePatterns= MM/dd/uuuu HH:mm:ssXXX
অতিরিক্ত java.time.format.DateTimeFormatter প্যাটার্নের একটি সেমিকোলন-বিচ্ছিন্ন তালিকা। মেটাডেটা বা স্কিমার কোনো তারিখ বা তারিখ-সময় ক্ষেত্রের জন্য স্ট্রিং মান পার্স করার সময় প্যাটার্ন ব্যবহার করা হয়। ডিফল্ট মান একটি খালি তালিকা, কিন্তু RFC 3339 এবং RFC 1123 বিন্যাস সর্বদা সমর্থিত।

স্ট্রাকচার্ড ডেটা

ক্লাউড সার্চ ইন্ডেক্সিং এপিআই একটি স্কিমা পরিষেবা প্রদান করে যা আপনি কীভাবে ক্লাউড সার্চ ইন্ডেক্স করে এবং আপনার ডেটা পরিবেশন করে তা কাস্টমাইজ করতে ব্যবহার করতে পারেন। আপনি যদি স্থানীয় সংগ্রহস্থল স্কিমা ব্যবহার করেন, তাহলে আপনাকে অবশ্যই স্ট্রাকচার্ড ডেটা স্থানীয় স্কিমার নাম উল্লেখ করতে হবে।

বিন্যাস প্যারামিটার
স্থানীয় স্কিমার নাম structuredData.localSchema = mySchemaName

স্কিমার নাম ডাটা উৎস থেকে পড়া হয় এবং রিপোজিটরি স্ট্রাকচার্ড ডেটার জন্য ব্যবহার করা হয়।

ডিফল্ট একটি খালি স্ট্রিং।

বিষয়বস্তু এবং অনুসন্ধানের গুণমান

রেকর্ড বা ক্ষেত্র-ভিত্তিক বিষয়বস্তু (যেমন একটি CRM, CVS, বা ডাটাবেস) ধারণ করা সংগ্রহস্থলগুলির জন্য, SDK ডেটা ক্ষেত্রের জন্য স্বয়ংক্রিয় HTML বিন্যাসের অনুমতি দেয়। আপনার সংযোগকারী সংযোগকারী কার্যকর করার শুরুতে ডেটা ক্ষেত্রগুলিকে সংজ্ঞায়িত করে এবং তারপর ক্লাউড অনুসন্ধানে আপলোড করার আগে প্রতিটি ডেটা রেকর্ড ফর্ম্যাট করতে একটি সামগ্রী টেমপ্লেট ব্যবহার করে৷

বিষয়বস্তু টেমপ্লেট অনুসন্ধানের জন্য প্রতিটি ক্ষেত্রের মানের গুরুত্ব নির্ধারণ করে। HTML <title> ক্ষেত্রটি প্রয়োজন এবং সর্বোচ্চ অগ্রাধিকার হিসাবে সংজ্ঞায়িত করা হয়েছে। আপনি অন্যান্য সমস্ত বিষয়বস্তুর ক্ষেত্রের জন্য অনুসন্ধানের গুণমানের গুরুত্বের মাত্রা নির্ধারণ করতে পারেন: উচ্চ, মাঝারি বা নিম্ন৷ কোনো বিষয়বস্তু ক্ষেত্র একটি নির্দিষ্ট বিভাগে সংজ্ঞায়িত না হলে কম অগ্রাধিকারে ডিফল্ট হয়।

বিন্যাস প্যারামিটার
বিষয়বস্তু HTML শিরোনাম contentTemplate.templateName.title = myTitleField

বিষয়বস্তু HTML শিরোনাম এবং সর্বোচ্চ অনুসন্ধান মানের ক্ষেত্র। আপনি যদি একটি HTML সামগ্রী টেমপ্লেট ব্যবহার করেন তবেই এই প্যারামিটারটি প্রয়োজন৷ ডিফল্ট মান একটি খালি স্ট্রিং।

বিষয়বস্তু ক্ষেত্রের জন্য উচ্চ অনুসন্ধান গুণমান contentTemplate.templateName.quality.high = hField1,hField2

বিষয়বস্তু ক্ষেত্র একটি উচ্চ অনুসন্ধান অগ্রাধিকার দেওয়া. ডিফল্ট একটি খালি স্ট্রিং।

বিষয়বস্তু ক্ষেত্রের জন্য মাঝারি অনুসন্ধান গুণমান contentTemplate.templateName.quality.medium = mField1,mField2

বিষয়বস্তু ক্ষেত্র একটি মাঝারি অনুসন্ধান অগ্রাধিকার দেওয়া. ডিফল্ট একটি খালি স্ট্রিং।

বিষয়বস্তু ক্ষেত্রের জন্য নিম্ন অনুসন্ধান গুণমান contentTemplate.templateName.quality.low = lField1,lField2

কম অনুসন্ধান অগ্রাধিকার দেওয়া বিষয়বস্তু ক্ষেত্র. ডিফল্ট একটি খালি স্ট্রিং।

অনির্দিষ্ট বিষয়বস্তু ক্ষেত্র contentTemplate.templateName.unmappedColumnsMode = value

সংযোগকারী কিভাবে অনির্দিষ্ট বিষয়বস্তু ক্ষেত্র পরিচালনা করে। বৈধ মান হল:

  • APPEND — টেমপ্লেটে অনির্দিষ্ট বিষয়বস্তু ক্ষেত্র যুক্ত করুন
  • IGNORE —অনির্দিষ্ট বিষয়বস্তু ক্ষেত্র উপেক্ষা করুন

    ডিফল্ট মান হল APPEND

HTML টেমপ্লেটে ক্ষেত্রের নাম অন্তর্ভুক্ত করুন contentTemplate.templateName.includeFieldName = true|false

এইচটিএমএল টেমপ্লেটে ক্ষেত্রের ডেটা সহ ক্ষেত্রের নাম অন্তর্ভুক্ত করতে হবে কিনা তা নির্দিষ্ট করে। ডিফল্টটি true এবং বিষয়বস্তু ডেটার অংশ হিসাবে ক্ষেত্রের নামগুলি অনুসন্ধানযোগ্য করে তোলে।

অস্বাভাবিকভাবে সেট প্যারামিটার

আপনাকে খুব কমই এই বিভাগে তালিকাভুক্ত পরামিতি সেট করতে হবে। প্যারামিটারের ডিফল্ট সর্বোত্তম কর্মক্ষমতা জন্য সেট করা হয়. Google আপনার সংগ্রহস্থলের মধ্যে নির্দিষ্ট প্রয়োজনীয়তা ছাড়াই এই প্যারামিটারগুলিকে তাদের ডিফল্ট থেকে ভিন্ন মানগুলিতে সেট করার সুপারিশ করে না।

প্রক্সি কনফিগারেশন

SDK আপনাকে বহির্গামী সংযোগের জন্য একটি প্রক্সি ব্যবহার করার জন্য আপনার সংযোগকারীকে কনফিগার করার অনুমতি দেয়৷

একটি প্রক্সির মাধ্যমে পরিবহন সক্ষম করার জন্য transport.proxy.hostname এবং transport.proxy.port প্যারামিটার প্রয়োজন৷ আপনার প্রক্সির প্রমাণীকরণের প্রয়োজন হলে বা HTTP এর পরিবর্তে SOCKS প্রোটোকলের মাধ্যমে কাজ করলে অন্যান্য পরামিতিগুলির প্রয়োজন হতে পারে৷ transport.proxy.hostname সেট না থাকলে, SDK প্রক্সি ব্যবহার করবে না।

বিন্যাস প্যারামিটার
হোস্টনাম transport.proxy.hostname = hostname

প্রক্সি সার্ভারের হোস্টনাম। একটি প্রক্সি ব্যবহার করার সময় এই প্যারামিটারটি প্রয়োজন।

বন্দর transport.proxy.port = port

প্রক্সি সার্ভারের জন্য পোর্ট নম্বর। একটি প্রক্সি ব্যবহার করার সময় এই প্যারামিটারটি প্রয়োজন।

প্রক্সি টাইপ transport.proxy.type = type

প্রক্সির ধরন। বৈধ মান হল:

  • HTTP — প্রক্সি HTTP এর মাধ্যমে অনুরোধগুলি গ্রহণ করে এবং ফরওয়ার্ড করে।
  • SOCKS — প্রক্সি SOCKS প্রোটোকলের উপর প্যাকেট গ্রহণ করে এবং ফরোয়ার্ড করে।

ডিফল্ট মান হল HTTP

ব্যবহারকারীর নাম transport.proxy.username = username

একটি প্রক্সি অনুমোদন টোকেন তৈরি করার সময় ব্যবহার করার জন্য ব্যবহারকারীর নাম৷ এই প্যারামিটারটি ঐচ্ছিক, এবং শুধুমাত্র তখনই সেট করা উচিত যদি আপনার প্রক্সির প্রমাণীকরণের প্রয়োজন হয়।

পাসওয়ার্ড transport.proxy.password = password

একটি প্রক্সি অনুমোদন টোকেন তৈরি করার সময় ব্যবহার করা পাসওয়ার্ড৷ এই প্যারামিটারটি ঐচ্ছিক, এবং শুধুমাত্র তখনই সেট করা উচিত যদি আপনার প্রক্সির প্রমাণীকরণের প্রয়োজন হয়।

ট্রাভার্স

SDK আপনাকে একটি ডেটা রিপোজিটরির সমান্তরাল ট্রাভার্সালের অনুমতি দেওয়ার জন্য একাধিক পৃথক ট্রাভার্স নির্দিষ্ট করতে সক্ষম করে। SDK টেমপ্লেট সংযোগকারীরা এই বৈশিষ্ট্যটি ব্যবহার করে।

বিন্যাস প্যারামিটার
থ্রেড পুল আকার traverse.threadPoolSize = size

সমান্তরাল প্রক্রিয়াকরণের জন্য সংযোজক তৈরি করে এমন থ্রেডের সংখ্যা। একটি একক পুনরাবৃত্তিকারী ক্রমিকভাবে ক্রিয়াকলাপ নিয়ে আসে (সাধারণত রিপোজিটরি ডক অবজেক্ট), কিন্তু এপিআই এই সংখ্যক থ্রেড ব্যবহার করে সমান্তরালভাবে প্রক্রিয়াগুলিকে কল করে।

ডিফল্ট মান হল 5

পার্টিশনের মাপ traverse.partitionSize = batchSize

অতিরিক্ত APIOperation আনার আগে ব্যাচে প্রক্রিয়াকরণ করা ApiOperation() এর সংখ্যা।

ডিফল্ট মান 50

ট্রাভার্স পোল অনুরোধ

ক্লাউড সার্চ ইন্ডেক্সিং সারির মূল হল একটি অগ্রাধিকার সারি যেখানে বিদ্যমান প্রতিটি আইটেমের জন্য একটি এন্ট্রি থাকে। একটি তালিকা সংযোগকারী ইন্ডেক্সিং API থেকে পোল আইটেমগুলির জন্য অনুরোধ করতে পারে৷ একটি পোল অনুরোধ ইন্ডেক্সিং সারি থেকে সর্বোচ্চ অগ্রাধিকার এন্ট্রি পায়।

নিম্নলিখিত পরামিতিগুলি SDK তালিকা সংযোগকারী টেমপ্লেট দ্বারা পোলিং প্যারামিটারগুলি সংজ্ঞায়িত করার জন্য ব্যবহার করা হয়৷

বিন্যাস প্যারামিটার
রিপোজিটরি ট্রাভার্স repository.traversers = t1, t2, t3, ...

এক বা একাধিক পৃথক ট্রাভার্স তৈরি করে যেখানে t1 , t2 , t3 , ... প্রতিটির অনন্য নাম। প্রতিটি নামধারী ট্র্যাভারসারের নিজস্ব সেটিংসের সেট রয়েছে যা ট্রাভার্সারের অনন্য নাম ব্যবহার করে চিহ্নিত করা হয়, যেমন traversers.t1.hostload এবং traversers.t2.hostload

ভোটের জন্য সারি traverser.pollRequest.queue = mySpecialQueue

সারির নাম যে এই ট্রাভার্স পোল করে। ডিফল্টটি খালি স্ট্রিং (ইঙ্গিত করে "ডিফল্ট")।

traverser. t1 .pollRequest.queue = mySpecialQueue

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

পোলিং আচরণ traverser.pollRequest.limit = maxItems

একটি পোলিং অনুরোধ থেকে আইটেমের সর্বাধিক সংখ্যা। ডিফল্ট মান হল 0 (এপিআই সর্বাধিক বোঝায়)।

traverser. t1 .pollRequest.limit = limit

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

আইটেম অবস্থা traverser.pollRequest.statuses = statuses

নির্দিষ্ট আইটেমের স্ট্যাটাস যা এই ট্রাভার্স পোল করে, যেখানে statuses MODIFIED, NEW_ITEM (কমা দ্বারা পৃথক করা) এর যেকোন সমন্বয় হতে পারে, ডিফল্টটি একটি খালি স্ট্রিং (সমস্ত স্থিতি মান বোঝায়)।

traverser. t1 .pollRequest.statuses = statusesForThisTraverser

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

হোস্ট লোড traverser.hostload = threads

ভোটের জন্য সর্বাধিক সক্রিয় সমান্তরাল থ্রেড উপলব্ধ। ডিফল্ট মান 5.

traverser. t1 .hostload = threadsForThisTraverser

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

সময় শেষ traverser.timeout = timeout

এই ট্রাভার্স পোল প্রয়াসে বাধা দেওয়ার জন্য সময়সীমার মান।

ডিফল্ট মান 60

traverser. t1 .timeout = timeoutForThisTraverser

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

traverser.timeunit = timeoutUunit

টাইমআউট ইউনিট। বৈধ মান হল SECONDS, MINUTES,

ট্রাভার্স t1 .timeunit = timeoutUnit

যখন আপনার একাধিক ট্রাভার্স থাকে, তখন প্রতিটি ট্রাভার্সারের জন্য আইটেমের স্ট্যাটাস সেট করুন (যেখানে t1 , একটি নির্দিষ্ট ট্রাভার্সের প্রতিনিধিত্ব করে)।

বেশিরভাগ ক্ষেত্রে, SDK তালিকা সংযোগকারী টেমপ্লেট ব্যবহার করে একটি সংযোগকারীর শুধুমাত্র ভোটদানের জন্য প্যারামিটারের একটি সেট প্রয়োজন। কিছু ক্ষেত্রে, আপনার ট্রাভার্সাল অ্যালগরিদমের জন্য আলাদা আলাদা সারি ব্যবহার করে আইটেম প্রক্রিয়াকরণের প্রয়োজন হলে আপনাকে একাধিক পোলিং মানদণ্ড নির্ধারণ করতে হতে পারে, উদাহরণস্বরূপ।

এই ক্ষেত্রে, আপনার কাছে পোলিং প্যারামিটারের একাধিক সেট সংজ্ঞায়িত করার বিকল্প রয়েছে। repository.traversers ব্যবহার করে প্যারামিটার সেটের নাম উল্লেখ করে শুরু করুন। প্রতিটি সংজ্ঞায়িত ট্রাভার্সার নামের জন্য, ট্র্যাভার্সের নামের সাথে t1 প্রতিস্থাপন করে উপরের টেবিলের প্যারামিটার সহ কনফিগারেশন ফাইল সরবরাহ করুন। এটি প্রতিটি সংজ্ঞায়িত ট্রাভার্সের জন্য পোলিং প্যারামিটারের একটি সেট তৈরি করে।

চেকপয়েন্ট

একটি চেকপয়েন্ট একটি ক্রমবর্ধমান ট্রাভার্সালের অবস্থা ট্র্যাক করার জন্য দরকারী।

বিন্যাস প্যারামিটার
চেকপয়েন্ট ডিরেক্টরি connector.checkpointDirectory = /path/to/checkpoint

ক্রমবর্ধমান এবং সম্পূর্ণ ট্রাভার্সাল চেকপয়েন্টগুলির জন্য ব্যবহার করার জন্য স্থানীয় ডিরেক্টরির পথ নির্দিষ্ট করে।

বিষয়বস্তু আপলোড

যখন বিষয়বস্তুর আকার নির্দিষ্ট থ্রেশহোল্ড অতিক্রম না করে তখন আইটেম সামগ্রীটি আইটেমের সাথে ক্লাউড অনুসন্ধানে আপলোড করা হয়৷ কন্টেন্টের আকার থ্রেশহোল্ড অতিক্রম করলে, কন্টেন্টটি আইটেমের মেটাডেটা এবং স্ট্রাকচার্ড ডেটা থেকে আলাদাভাবে আপলোড করা হয়।

বিন্যাস প্যারামিটার
কন্টেন্ট থ্রেশহোল্ড api.contentUploadThresholdBytes = bytes

কন্টেন্টের থ্রেশহোল্ড যা নির্ধারণ করে যে এটি একটি পৃথক আপলোড ব্যবহার করে আইটেমের সাথে "ইন-লাইন" আপলোড করা হয়েছে কিনা।

ডিফল্ট মান হল 100000 (~100KB)।

পাত্রে

সম্পূর্ণ সংযোগকারী টেমপ্লেটটি ডাটাবেসে মুছে ফেলা রেকর্ডগুলি সনাক্ত করার জন্য একটি অস্থায়ী ডেটা উত্স সারি টগলের ধারণা জড়িত একটি অ্যালগরিদম ব্যবহার করে। এর মানে হল প্রতিটি পূর্ণ ট্রাভার্সালের উপর, আনা রেকর্ডগুলি, যা একটি নতুন সারিতে রয়েছে, পূর্ববর্তী ট্রাভার্সাল থেকে সূচীকৃত সমস্ত বিদ্যমান ক্লাউড অনুসন্ধান রেকর্ডগুলিকে প্রতিস্থাপন করে, যা একটি পুরানো সারিতে রয়েছে৷

বিন্যাস প্যারামিটার
ধারক নাম ট্যাগ traverse.queueTag = instance

একে অপরের সাথে হস্তক্ষেপ না করে একটি সাধারণ ডেটা রিপোজিটরির (বিভিন্ন ডেটা রিপোজিটরিতে হোক বা একটি সাধারণ ডেটা রিপোজিটরির আলাদা অংশে হোক) সূচকের সমান্তরালে সংযোগকারীর একাধিক উদাহরণ চালানোর জন্য, সংযোগকারীর প্রতিটি রানে একটি অনন্য কন্টেইনার নামের ট্যাগ বরাদ্দ করুন। একটি অনন্য নামের ট্যাগ একটি সংযোগকারীর উদাহরণকে অন্যের রেকর্ড মুছে ফেলা থেকে বাধা দেয়।

নামের ট্যাগটি সম্পূর্ণ ট্রাভার্সাল সংযোগকারী টগল সারি আইডিতে যুক্ত করা হয়েছে।

ডিলিট ডিটেকশন অক্ষম করুন traverse.useQueues =true|false

মুছে ফেলার সনাক্তকরণের জন্য সংযোগকারী সারি টগল লজিক ব্যবহার করে কিনা তা নির্দেশ করে।

ডিফল্ট মান true , যা নির্দিষ্ট করে যে সারি ব্যবহার করা উচিত।

দ্রষ্টব্য : এই কনফিগারেশন প্যারামিটার শুধুমাত্র FullTraversalConnector টেমপ্লেট বাস্তবায়নকারী সংযোগকারীদের জন্য প্রযোজ্য।

ব্যাচ নীতি

SDK একটি ব্যাচ নীতি সমর্থন করে যা আপনাকে নিম্নলিখিত ক্রিয়াগুলি সম্পাদন করতে সক্ষম করে:

  • ব্যাচ অনুরোধ
  • একটি ব্যাচ সারিতে অনুরোধের সংখ্যা উল্লেখ করুন
  • একযোগে কার্যকরী ব্যাচগুলি পরিচালনা করুন
  • ফ্লাশ ব্যাচড অনুরোধ

SDK আপলোডের সময় গতি থ্রুপুট করার জন্য সংযোগকারীর অনুরোধগুলিকে একসাথে ব্যাচ করে। অনুরোধের একটি ব্যাচ আপলোড করার জন্য SDK ট্রিগার হয় অনুরোধের সংখ্যা বা টাইমআউট, যেটি প্রথমে আসে। উদাহরণস্বরূপ, যদি ব্যাচের বিলম্বের সময় ব্যাচের আকার না পৌঁছে শেষ হয়ে যায়, অথবা যদি বিলম্বের সময় শেষ হওয়ার আগে আইটেমগুলির ব্যাচ আকারের সংখ্যা পৌঁছে যায়, তাহলে ব্যাচ আপলোডটি ট্রিগার হয়।

বিন্যাস প্যারামিটার
ব্যাচ অনুরোধ batch.batchSize = batchSize

ব্যাচ একসাথে অনুরোধ. ডিফল্ট মান হল 10

একটি ব্যাচ সারিতে অনুরোধের সংখ্যা batch.maxQueueLength = maxQueueLength

এক্সিকিউশনের জন্য একটি ব্যাচ সারিতে সর্বোচ্চ সংখ্যক অনুরোধ। ডিফল্ট মান 1000.

একযোগে ব্যাচ নির্বাহ batch.maxActiveBatches = maxActiveBatches

একযোগে কার্যকরী ব্যাচের অনুমোদনযোগ্য সংখ্যা। ডিফল্ট মান হল 20

ব্যাচ করা অনুরোধ স্বয়ংক্রিয়ভাবে ফ্লাশ করুন batch.maxBatchDelaySeconds = maxBatchDelay

ব্যাচ করা অনুরোধগুলি স্বয়ংক্রিয়ভাবে ফ্লাশ হওয়ার আগে অপেক্ষা করতে সেকেন্ডের সংখ্যা। ডিফল্ট মান হল 5

শাটডাউনে ব্যাচ করা অনুরোধগুলি ফ্লাশ করুন batch.flushOnShutdown = true|false

পরিষেবা বন্ধ করার সময় ব্যাচ করা অনুরোধগুলি ফ্লাশ করুন। প্রচলিত মূল্য true

ব্যতিক্রম হ্যান্ডলার

ব্যতিক্রম হ্যান্ডলার পরামিতি নির্ধারণ করে যে এটি একটি ব্যতিক্রমের সম্মুখীন হওয়ার পর ট্রাভার্স কিভাবে এগিয়ে যায়।

বিন্যাস প্যারামিটার
ত্রুটির ক্ষেত্রে ট্রাভার্সের নির্দেশনা traverse.exceptionHandler = exceptions

একটি ব্যতিক্রম নিক্ষেপ করার পরে ট্রাভার্সের কীভাবে এগিয়ে যাওয়া উচিত। বৈধ মান হল:

  • 0 -- একটি ব্যতিক্রমের সম্মুখীন হওয়ার পর সর্বদা ট্রাভার্সাল বাতিল করুন
  • num_exceptions (উদাহরণস্বরূপ, 10 )- - ট্রাভার্স নির্দিষ্ট num_exceptions সম্মুখীন হওয়ার পরে বাতিল করুন।

    ডিফল্ট মান হল 0 (সর্বদা ত্রুটি হলে বাতিল করুন)।

  • ignore -- ত্রুটি উপেক্ষা করুন
ব্যতিক্রমগুলির মধ্যে সময় অপেক্ষা করুন abortExceptionHander.backoffMilliSeconds = backoff

শনাক্ত হ্যান্ডলার ব্যতিক্রমগুলির মধ্যে অপেক্ষা করার জন্য মিলিসেকেন্ডে ব্যাকঅফ সময় (সাধারণত একটি সংগ্রহস্থল অতিক্রম করার সময় ব্যবহৃত হয়)। ডিফল্ট মান হল 10