এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

একটি বিষয়বস্তু সংযোগকারী তৈরি করুন

কন্টেন্ট কানেক্টর হল একটি সফটওয়্যার প্রোগ্রাম যা একটি এন্টারপ্রাইজের রিপোজিটরিতে ডেটা স্থানান্তর করতে এবং একটি ডেটা উৎস পূরণ করতে ব্যবহৃত হয়। কন্টেন্ট কানেক্টর তৈরির জন্য গুগল নিম্নলিখিত বিকল্পগুলি প্রদান করে:

কন্টেন্ট কানেক্টর SDK। যদি আপনি জাভাতে প্রোগ্রামিং করেন তবে এটি একটি ভালো বিকল্প। কন্টেন্ট কানেক্টর SDK হল REST API এর চারপাশে একটি মোড়ক যা আপনাকে দ্রুত সংযোগকারী তৈরি করতে দেয়। SDK ব্যবহার করে একটি কন্টেন্ট কানেক্টর তৈরি করতে, কন্টেন্ট কানেক্টর SDK ব্যবহার করে একটি কন্টেন্ট কানেক্টর তৈরি করুন দেখুন।
একটি নিম্ন-স্তরের REST API বা API লাইব্রেরি। যদি আপনি জাভাতে প্রোগ্রামিং না করেন, অথবা আপনার কোডবেস যদি REST API বা লাইব্রেরি আরও ভালভাবে সামঞ্জস্যপূর্ণ হয় তবে এই বিকল্পগুলি ব্যবহার করুন। REST API ব্যবহার করে একটি কন্টেন্ট সংযোগকারী তৈরি করতে, REST API ব্যবহার করে একটি কন্টেন্ট সংযোগকারী তৈরি করুন দেখুন।

একটি সাধারণ কন্টেন্ট সংযোগকারী নিম্নলিখিত কাজগুলি সম্পাদন করে:

কনফিগারেশন প্যারামিটারগুলি পড়ে এবং প্রক্রিয়া করে।
তৃতীয় পক্ষের কন্টেন্ট রিপোজিটরি থেকে " items " নামক সূচীযোগ্য ডেটার বিচ্ছিন্ন অংশ টেনে আনে।
ACL, মেটাডেটা এবং কন্টেন্ট ডেটাকে সূচীযোগ্য আইটেমগুলিতে একত্রিত করে।
ক্লাউড সার্চ ডেটা সোর্সে আইটেমগুলিকে সূচীবদ্ধ করে।
(ঐচ্ছিক) তৃতীয় পক্ষের কন্টেন্ট রিপোজিটরি থেকে পরিবর্তনের বিজ্ঞপ্তিগুলি শোনে। ক্লাউড সার্চ ডেটা সোর্সকে তৃতীয় পক্ষের রিপোজিটরির সাথে সিঙ্ক করার জন্য পরিবর্তনের বিজ্ঞপ্তিগুলি ইন্ডেক্সিং অনুরোধে রূপান্তরিত হয়। সংযোগকারীটি কেবল তখনই এই কাজটি সম্পাদন করে যদি রিপোজিটরি পরিবর্তন সনাক্তকরণ সমর্থন করে।

কন্টেন্ট কানেক্টর SDK ব্যবহার করে একটি কন্টেন্ট কানেক্টর তৈরি করুন

নিম্নলিখিত বিভাগগুলিতে কন্টেন্ট কানেক্টর SDK ব্যবহার করে কীভাবে একটি কন্টেন্ট কানেক্টর তৈরি করতে হয় তা ব্যাখ্যা করা হয়েছে।

নির্ভরতা সেট আপ করুন

SDK ব্যবহার করার জন্য আপনার বিল্ড ফাইলে নির্দিষ্ট কিছু নির্ভরতা অন্তর্ভুক্ত করতে হবে। আপনার বিল্ড পরিবেশের নির্ভরতা দেখতে নীচের একটি ট্যাবে ক্লিক করুন:

মাভেন

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

গ্রেডল

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

আপনার সংযোগকারী কনফিগারেশন তৈরি করুন

প্রতিটি সংযোগকারীর একটি কনফিগারেশন ফাইল থাকে যাতে সংযোগকারী দ্বারা ব্যবহৃত প্যারামিটার থাকে, যেমন আপনার সংগ্রহস্থলের আইডি। পরামিতিগুলিকে কী-মান জোড়া হিসাবে সংজ্ঞায়িত করা হয়, যেমন api.sourceId= 1234567890abcdef ।

Google Cloud Search SDK-তে সমস্ত সংযোগকারীর দ্বারা ব্যবহৃত বেশ কয়েকটি Google-সরবরাহকৃত কনফিগারেশন প্যারামিটার রয়েছে। আপনার কনফিগারেশন ফাইলে আপনাকে নিম্নলিখিত Google-সরবরাহকৃত প্যারামিটারগুলি ঘোষণা করতে হবে:

একটি কন্টেন্ট সংযোগকারীর জন্য, আপনাকে api.sourceId এবং api.serviceAccountPrivateKeyFile ঘোষণা করতে হবে কারণ এই প্যারামিটারগুলি আপনার সংগ্রহস্থলের অবস্থান এবং সংগ্রহস্থল অ্যাক্সেস করার জন্য প্রয়োজনীয় ব্যক্তিগত কী সনাক্ত করে।

একটি আইডেন্টিটি কানেক্টরের জন্য, আপনাকে api.identitySourceId ডিক্লেয়ার করতে হবে কারণ এই প্যারামিটারটি আপনার এক্সটার্নাল আইডেন্টিটি সোর্সের অবস্থান শনাক্ত করে। আপনি যদি ব্যবহারকারীদের সিঙ্ক করেন, তাহলে আপনার এন্টারপ্রাইজের Google Workspace অ্যাকাউন্টের জন্য আপনাকে api.customerId ইউনিক আইডি হিসেবেও ডিক্লেয়ার করতে হবে।

যদি না আপনি অন্যান্য Google-সরবরাহকৃত প্যারামিটারের ডিফল্ট মানগুলিকে ওভাররাইড করতে চান, তাহলে আপনার কনফিগারেশন ফাইলে সেগুলি ঘোষণা করার প্রয়োজন নেই। Google-সরবরাহকৃত কনফিগারেশন প্যারামিটার সম্পর্কে অতিরিক্ত তথ্যের জন্য, যেমন নির্দিষ্ট আইডি এবং কী কীভাবে তৈরি করতে হয়, Google-সরবরাহকৃত কনফিগারেশন প্যারামিটারগুলি দেখুন।

আপনার কনফিগারেশন ফাইলে ব্যবহারের জন্য আপনি আপনার নিজস্ব সংগ্রহস্থল-নির্দিষ্ট পরামিতিগুলিও সংজ্ঞায়িত করতে পারেন।

কনফিগারেশন ফাইলটি সংযোগকারীতে পাস করুন।

আপনার সংযোগকারীতে কনফিগারেশন ফাইলটি পাস করার জন্য সিস্টেম প্রপার্টি config সেট করুন। সংযোগকারী শুরু করার সময় আপনি -D আর্গুমেন্ট ব্যবহার করে বৈশিষ্ট্যটি সেট করতে পারেন। উদাহরণস্বরূপ, নিম্নলিখিত কমান্ডটি MyConfig.properties কনফিগারেশন ফাইল দিয়ে সংযোগকারীটি শুরু করে:

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

যদি এই যুক্তিটি অনুপস্থিত থাকে, তাহলে SDK connector-config.properties নামের একটি ডিফল্ট কনফিগারেশন ফাইল অ্যাক্সেস করার চেষ্টা করে।

আপনার ট্রাভার্সাল কৌশল নির্ধারণ করুন

একটি কন্টেন্ট কানেক্টরের প্রাথমিক কাজ হল একটি রিপোজিটরি অতিক্রম করা এবং এর ডেটা সূচী করা। আপনার রিপোজিটরিতে থাকা ডেটার আকার এবং বিন্যাসের উপর ভিত্তি করে আপনাকে একটি ট্রাভার্সাল কৌশল বাস্তবায়ন করতে হবে। আপনি নিজের কৌশল ডিজাইন করতে পারেন অথবা SDK-তে বাস্তবায়িত নিম্নলিখিত কৌশলগুলি থেকে বেছে নিতে পারেন:

সম্পূর্ণ ট্রাভার্সাল কৌশল

একটি সম্পূর্ণ ট্র্যাভার্সাল কৌশল সম্পূর্ণ রিপোজিটরি স্ক্যান করে এবং অন্ধভাবে প্রতিটি আইটেমকে সূচীবদ্ধ করে। এই কৌশলটি সাধারণত তখন ব্যবহৃত হয় যখন আপনার একটি ছোট রিপোজিটরি থাকে এবং প্রতিবার ইনডেক্স করার সময় একটি সম্পূর্ণ ট্র্যাভার্সাল করার জন্য ওভারহেড বহন করতে পারে।

এই ট্র্যাভার্সাল কৌশলটি ছোট রিপোজিটরিগুলির জন্য উপযুক্ত যেখানে বেশিরভাগই স্ট্যাটিক, নন-হায়ারার্কিকাল, ডেটা থাকে। পরিবর্তন সনাক্তকরণ কঠিন হলে বা রিপোজিটরি দ্বারা সমর্থিত না হলে আপনি এই ট্র্যাভার্সাল কৌশলটিও ব্যবহার করতে পারেন।

ট্র্যাভার্সাল কৌশল তালিকাভুক্ত করুন

একটি তালিকা ট্র্যাভার্সাল কৌশল সমগ্র সংগ্রহস্থল স্ক্যান করে, সমস্ত চাইল্ড নোড সহ, প্রতিটি আইটেমের অবস্থা নির্ধারণ করে। তারপর, সংযোগকারীটি দ্বিতীয় পাস নেয় এবং শুধুমাত্র নতুন বা শেষ সূচীকরণের পর থেকে আপডেট করা আইটেমগুলিকে সূচী করে। এই কৌশলটি সাধারণত একটি বিদ্যমান সূচকের ক্রমবর্ধমান আপডেট সম্পাদন করতে ব্যবহৃত হয় (প্রতিবার সূচক আপডেট করার সময় একটি সম্পূর্ণ ট্র্যাভার্সাল করার পরিবর্তে)।

এই ট্রাভার্সাল কৌশলটি তখনই উপযুক্ত যখন পরিবর্তন সনাক্তকরণ কঠিন হয় অথবা রিপোজিটরি দ্বারা সমর্থিত নয়, আপনার কাছে নন-হায়ারার্কিকাল ডেটা থাকে এবং আপনি খুব বড় ডেটা সেট নিয়ে কাজ করেন।

গ্রাফ ট্রাভার্সাল

একটি গ্রাফ ট্র্যাভার্সাল কৌশল প্রতিটি আইটেমের অবস্থা নির্ধারণ করে সম্পূর্ণ প্যারেন্ট নোড স্ক্যান করে। তারপর, সংযোগকারীটি দ্বিতীয় পাস নেয় এবং শুধুমাত্র রুট নোডের আইটেমগুলিকে সূচী করে যা নতুন বা শেষ সূচীকরণের পর থেকে আপডেট করা হয়েছে। অবশেষে, সংযোগকারী যেকোনো চাইল্ড আইডি পাস করে তারপর চাইল্ড নোডের আইটেমগুলিকে সূচী করে যা নতুন বা আপডেট করা হয়েছে। সংযোগকারীটি সমস্ত চাইল্ড নোডের মাধ্যমে পুনরাবৃত্তিমূলকভাবে চলতে থাকে যতক্ষণ না সমস্ত আইটেম সম্বোধন করা হয়। এই ধরনের ট্র্যাভার্সাল সাধারণত হায়ারার্কিকাল রিপোজিটরিগুলির জন্য ব্যবহৃত হয় যেখানে সমস্ত আইডি তালিকাভুক্ত করা ব্যবহারিক নয়।

এই কৌশলটি উপযুক্ত যদি আপনার কাছে এমন শ্রেণিবদ্ধ ডেটা থাকে যা ক্রল করার প্রয়োজন হয়, যেমন ডিরেক্টরি বা ওয়েব পৃষ্ঠাগুলির একটি সিরিজ।

এই প্রতিটি ট্র্যাভার্সাল কৌশল SDK-তে একটি টেমপ্লেট সংযোগকারী শ্রেণী দ্বারা বাস্তবায়িত হয়। আপনি নিজের ট্র্যাভার্সাল কৌশল বাস্তবায়ন করতে পারেন, তবে এই টেমপ্লেটগুলি আপনার সংযোগকারীর বিকাশকে ব্যাপকভাবে ত্বরান্বিত করে। একটি টেমপ্লেট ব্যবহার করে একটি সংযোগকারী তৈরি করতে, আপনার ট্র্যাভার্সাল কৌশলের সাথে সম্পর্কিত বিভাগটি অনুসরণ করুন:

একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি সম্পূর্ণ ট্র্যাভার্সাল সংযোগকারী তৈরি করুন
একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি তালিকা ট্র্যাভার্সাল সংযোগকারী তৈরি করুন
একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি গ্রাফ ট্র্যাভার্সাল সংযোগকারী তৈরি করুন

একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি সম্পূর্ণ ট্র্যাভার্সাল সংযোগকারী তৈরি করুন

ডক্সের এই অংশটি FullTraversalSample উদাহরণ থেকে কোড স্নিপেটগুলি উল্লেখ করে।

সংযোগকারীর প্রবেশ বিন্দু বাস্তবায়ন করুন

একটি সংযোগকারীর প্রবেশ বিন্দু হল main() পদ্ধতি। এই পদ্ধতির প্রাথমিক কাজ হল Application ক্লাসের একটি উদাহরণ তৈরি করা এবং সংযোগকারীটি চালানোর জন্য এর start() পদ্ধতিটি ব্যবহার করা।

application.start() কল করার আগে, FullTraversalConnector টেমপ্লেটটি ইন্সট্যান্ট করার জন্য IndexingApplication.Builder ক্লাস ব্যবহার করুন। FullTraversalConnector এমন একটি Repository অবজেক্ট গ্রহণ করে যার পদ্ধতিগুলি আপনি প্রয়োগ করেন। নিম্নলিখিত কোড স্নিপেটটি main() পদ্ধতিটি কীভাবে প্রয়োগ করবেন তা দেখায়:

ফুলট্রাভার্সালস্যাম্পল.জাভা

কন্টেন্ট কানেক্টর SDK ব্যবহার করে একটি কন্টেন্ট কানেক্টর তৈরি করুন

নির্ভরতা সেট আপ করুন

মাভেন

গ্রেডল

আপনার সংযোগকারী কনফিগারেশন তৈরি করুন

কনফিগারেশন ফাইলটি সংযোগকারীতে পাস করুন।

আপনার ট্রাভার্সাল কৌশল নির্ধারণ করুন

একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি সম্পূর্ণ ট্র্যাভার্সাল সংযোগকারী তৈরি করুন

সংযোগকারীর প্রবেশ বিন্দু বাস্তবায়ন করুন

Repository ইন্টারফেস বাস্তবায়ন করুন

কাস্টম কনফিগারেশন প্যারামিটার পান

একটি সম্পূর্ণ ট্রাভার্সাল সম্পাদন করুন

একটি আইটেমের জন্য অনুমতি সেট করুন

একটি আইটেমের জন্য মেটাডেটা সেট করুন

ইনডেক্সেবল আইটেম তৈরি করুন

প্রতিটি ইনডেক্সেবল আইটেম একটি ইটারেটরে প্যাকেজ করুন

পরবর্তী পদক্ষেপ

একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি তালিকা ট্র্যাভার্সাল সংযোগকারী তৈরি করুন

সংযোগকারীর প্রবেশ বিন্দু বাস্তবায়ন করুন

Repository ইন্টারফেস বাস্তবায়ন করুন

কাস্টম কনফিগারেশন প্যারামিটার পান

তালিকার ট্রাভার্সাল সম্পাদন করুন

পুশ আইটেম আইডি এবং হ্যাশ মান

প্রতিটি আইটেম উদ্ধার করুন এবং পরিচালনা করুন

মুছে ফেলা আইটেমগুলি পরিচালনা করুন

অপরিবর্তিত আইটেমগুলি পরিচালনা করুন

একটি আইটেমের জন্য অনুমতি সেট করুন

একটি আইটেমের জন্য মেটাডেটা সেট করুন

একটি ইনডেক্সেবল আইটেম তৈরি করুন

পরবর্তী পদক্ষেপ

একটি টেমপ্লেট ক্লাস ব্যবহার করে একটি গ্রাফ ট্র্যাভার্সাল সংযোগকারী তৈরি করুন

সংযোগকারীর প্রবেশ বিন্দু বাস্তবায়ন করুন

Repository ইন্টারফেস বাস্তবায়ন করুন

কাস্টম কনফিগারেশন প্যারামিটার পান

গ্রাফের ট্রাভার্সাল সম্পাদন করুন

পুশ আইটেম আইডি এবং হ্যাশ মান

Retrieve and handle each item

Handle deleted items

Set the permissions for an item

Set the metadata for an item

Create the indexable item

Place the child IDs in the Cloud Search Indexing Queue

Next Steps

Create a content connector using the REST API

Determine your traversal strategy

Implement your traversal strategy and index items

Handle repository changes

`Repository` ইন্টারফেস বাস্তবায়ন করুন

`Repository` ইন্টারফেস বাস্তবায়ন করুন

`Repository` ইন্টারফেস বাস্তবায়ন করুন