একটি CSV সংযোগকারী স্থাপন করুন

এই নির্দেশিকাটি Google Cloud Search CSV (কমা দ্বারা পৃথক করা মান) সংযোগকারী প্রশাসকদের জন্য যারা সংযোগকারী ডাউনলোড, কনফিগার, চালানো এবং পর্যবেক্ষণের জন্য দায়ী।

এই নির্দেশিকাটিতে এই গুরুত্বপূর্ণ কাজগুলির জন্য নির্দেশাবলী অন্তর্ভুক্ত রয়েছে:

  • ক্লাউড সার্চ CSV সংযোগকারী সফ্টওয়্যারটি ডাউনলোড করুন।
  • একটি নির্দিষ্ট CSV ডেটা উৎসের জন্য সংযোগকারীটি কনফিগার করুন।
  • সংযোগকারী স্থাপন করুন এবং চালান।

এই ডকুমেন্টের ধারণাগুলি বুঝতে, Google Workspace, CSV ফাইল এবং অ্যাক্সেস কন্ট্রোল লিস্ট (ACL) এর সাথে পরিচিত হন।

ক্লাউড সার্চ CSV সংযোগকারীর সংক্ষিপ্ত বিবরণ

ক্লাউড সার্চ CSV সংযোগকারী যেকোনো কমা-বিভাজিত মান (CSV) টেক্সট ফাইলের সাথে কাজ করে। একটি CSV ফাইল ট্যাবুলার ডেটা সংরক্ষণ করে, যেখানে প্রতিটি লাইন একটি ডেটা রেকর্ড।

সংযোগকারীটি একটি CSV ফাইল থেকে সারিগুলি বের করে এবং Indexing API ব্যবহার করে Cloud Search-এ সূচীবদ্ধ করে। একবার সূচীবদ্ধ হয়ে গেলে, ক্লাউড অনুসন্ধান ক্লায়েন্ট বা Query API-এর মাধ্যমে সারিগুলি অনুসন্ধানযোগ্য হয়। সংযোগকারীটি কন্টেন্টে ব্যবহারকারীর অ্যাক্সেস নিয়ন্ত্রণ করতে ACL-গুলিকেও সমর্থন করে।

আপনি লিনাক্স বা উইন্ডোজে সংযোগকারীটি ইনস্টল করতে পারেন। স্থাপনের আগে, নিশ্চিত করুন যে আপনার কাছে নিম্নলিখিত উপাদানগুলি আছে:

সাধারণত, ডোমেনের জন্য Google Workspace প্রশাসক এই শংসাপত্রগুলি সরবরাহ করেন।

স্থাপনের ধাপ

ক্লাউড সার্চ CSV সংযোগকারী স্থাপন করতে এই পদক্ষেপগুলি অনুসরণ করুন:

  1. সংযোগকারী সফ্টওয়্যার ইনস্টল করুন
  2. সংযোগকারীর কনফিগারেশন নির্দিষ্ট করুন
  3. ক্লাউড সার্চ ডেটা উৎসে অ্যাক্সেস কনফিগার করুন
  4. CSV ফাইল অ্যাক্সেস কনফিগার করুন
  5. কলামের নাম, অনন্য কী এবং ডেটটাইম কলাম নির্দিষ্ট করুন
  6. ক্লিকযোগ্য অনুসন্ধান ফলাফলের URL গুলির জন্য কলামগুলি নির্দিষ্ট করুন
  7. মেটাডেটা এবং কলামের ফর্ম্যাট নির্দিষ্ট করুন
  8. ডেটা ট্রাভার্সালের সময়সূচী নির্ধারণ করুন
  9. ACL বিকল্পগুলি নির্দিষ্ট করুন

১. SDK ইনস্টল করুন

আপনার স্থানীয় Maven সংগ্রহস্থলে SDK ইনস্টল করুন।

  1. GitHub থেকে SDK রিপোজিটরি ক্লোন করুন।

    $ git clone https://github.com/google-cloudsearch/connector-sdk.git
    $ cd connector-sdk/csv

  2. আপনার নির্বাচিত সংস্করণটি দেখুন:

    $ git checkout tags/v1-0.0.3

  3. সংযোগকারী তৈরি করুন:

    $ mvn package

  4. সংযোগকারীটি বের করে ইনস্টল করুন:

    $ cp target/google-cloudsearch-csv-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-csv-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-csv-connector-v1-0.0.3

2. CSV সংযোগকারী কনফিগারেশন নির্দিষ্ট করুন

আপনি সংযোগকারীর আচরণ নিয়ন্ত্রণ করতে পারেন তার কনফিগারেশন ফাইলের প্যারামিটারের মাধ্যমে। কনফিগারযোগ্য প্যারামিটারগুলির মধ্যে রয়েছে:

  • ডেটা সোর্স অ্যাক্সেস।
  • CSV ফাইলের অবস্থান এবং সংজ্ঞা।
  • অনন্য আইডি কলাম।
  • ট্র্যাভার্সাল এবং ACL বিকল্পগুলি।

একটি কনফিগারেশন ফাইল তৈরি করতে:

  1. একটি টেক্সট এডিটর খুলুন এবং ফাইলটির নাম দিন connector-config.properties
  2. key=value pairs হিসেবে কনফিগারেশন প্যারামিটার যোগ করুন, প্রতিটি pair একটি নতুন লাইনে রাখুন। একটি কনফিগারেশন ফাইলের উদাহরণের জন্য, Example configuration file দেখুন।

ট্র্যাকিং সহজ করার জন্য কনফিগারেশন ফাইলটি সংযোগকারীর মতো একই ডিরেক্টরিতে রাখুন। সংযোগকারী আপনার ফাইলটি চিনতে পারে তা নিশ্চিত করার জন্য, কমান্ড লাইনে এর পথটি নির্দিষ্ট করুন। অন্যথায়, সংযোগকারীটি আপনার স্থানীয় ডিরেক্টরিতে connector-config.properties এ ডিফল্টভাবে কাজ করে। সংযোগকারীটি চালান দেখুন।

৩. ক্লাউড সার্চ ডেটা উৎসে অ্যাক্সেস কনফিগার করুন

ক্লাউড সার্চ ডেটা সোর্স অ্যাক্সেস করার জন্য কনফিগারেশন ফাইলে অবশ্যই প্যারামিটার নির্দিষ্ট করতে হবে। আপনার ডেটা সোর্স আইডি, সার্ভিস অ্যাকাউন্ট আইডি এবং সার্ভিস অ্যাকাউন্টের প্রাইভেট কী ফাইলের পাথ প্রয়োজন।

বিন্যাস প্যারামিটার
ডেটা সোর্স আইডি api.sourceId= 1234567890abcdef

প্রয়োজন। Google Workspace অ্যাডমিনিস্ট্রেটর দ্বারা সেট আপ করা ক্লাউড সার্চ সোর্স আইডি।

পরিষেবা অ্যাকাউন্টের ব্যক্তিগত কী-এর পথ api.serviceAccountPrivateKeyFile= ./PrivateKey.json

প্রয়োজনীয়। সংযোগকারীর অ্যাক্সেসিবিলিটির জন্য পরিষেবা অ্যাকাউন্ট কী ফাইল।

পরিচয় উৎস আইডি api.identitySourceId= x0987654321

বহিরাগত ব্যবহারকারী এবং গোষ্ঠী ব্যবহার করলে প্রয়োজন। Google Workspace প্রশাসক দ্বারা সেট আপ করা পরিচয় উৎস আইডি।

৪. CSV ফাইল প্যারামিটার কনফিগার করুন

ফাইলের পথ, বিন্যাস এবং এনকোডিং সনাক্ত করুন।

বিন্যাস প্যারামিটার
CSV ফাইলের পথ csv.filePath= ./movie_content.csv

প্রয়োজনীয়। ইনডেক্সিংয়ের জন্য ফাইলের পথ।

ফাইল ফর্ম্যাট csv.format= DEFAULT

ফাইলের ফর্ম্যাট। সম্ভাব্য মানগুলি Apache Commons CSV CSVFormat ক্লাস থেকে নেওয়া হয়েছে।

ফর্ম্যাটের মানগুলির মধ্যে রয়েছে: DEFAULT , EXCEL , INFORMIX_UNLOAD , INFORMIX_UNLOAD_CSV , MYSQL , RFC4180 , ORACLE , POSTGRESQL_CSV , POSTGRESQL_TEXT , এবং TDF । যদি নির্দিষ্ট না করা থাকে, তাহলে Cloud Search DEFAULT ব্যবহার করে।

ফাইল ফরম্যাট মডিফায়ার csv.format. withMethod = value

ক্লাউড সার্চ ফাইলটি কীভাবে পরিচালনা করে তার একটি পরিবর্তন। সম্ভাব্য পদ্ধতিগুলি Apache Commons CSV CSVFormat ক্লাস থেকে নেওয়া হয়েছে এবং এতে এমন পদ্ধতি অন্তর্ভুক্ত রয়েছে যা একটি একক অক্ষর, স্ট্রিং বা বুলিয়ান মান নেয়।

উদাহরণস্বরূপ, একটি সেমিকোলনকে ডিলিমিটার হিসেবে নির্দিষ্ট করতে, csv.format.withDelimiter=; ব্যবহার করুন। খালি লাইন উপেক্ষা করতে, csv.format.withIgnoreEmptyLines=true ব্যবহার করুন।

ফাইল এনকোডিং টাইপ csv.fileEncoding= UTF-8

ব্যবহারের জন্য জাভা অক্ষর সেট। প্ল্যাটফর্ম অক্ষর সেটে ডিফল্ট।

৫. ইনডেক্স এবং অনন্য কী কলামের জন্য কলামের নাম উল্লেখ করুন

কনফিগারেশন ফাইলে কলামের তথ্য প্রদান করুন।

বিন্যাস প্যারামিটার
কলাম থেকে সূচী পর্যন্ত csv.csvColumns= movieId,movieTitle,description,actors,releaseDate,year,userratings...

CSV ফাইল থেকে কলামগুলির নাম সূচীবদ্ধ করা হবে। ডিফল্টরূপে, CSV-এর প্রথম সারিটি হেডার হিসেবে ব্যবহৃত হয়। যদি csv.csvColumns নির্দিষ্ট করা থাকে, তাহলে এটি অগ্রাধিকার পায়। csv.csvColumns সেট করা থাকলে এবং প্রথম সারিতে হেডার থাকা অবস্থায় প্রথম সারিটিকে ডেটা হিসেবে সূচীবদ্ধ করা এড়াতে, csv.skipHeaderRecord=true সেট করুন।

অনন্য কী কলাম csv.uniqueKeyColumns= movieId

একটি অনন্য আইডি তৈরি করতে ব্যবহৃত কলাম। রেকর্ডের হ্যাশকোডে ডিফল্ট।

৬. ক্লিকযোগ্য অনুসন্ধান ফলাফলের URL গুলির জন্য কলাম নির্দিষ্ট করুন

অনুসন্ধান ফলাফলের জন্য ক্লিকযোগ্য URL গুলি সক্ষম করুন।

বিন্যাস প্যারামিটার
সার্চ ফলাফলের URL ফর্ম্যাট url.format= https://mymoviesite.com/movies/{0}

প্রয়োজনীয়। ভিউ URL তৈরি করতে ব্যবহৃত ফর্ম্যাট।

URL প্যারামিটার url.columns= movieId

প্রয়োজনীয়। CSV কলামের নাম, যেগুলির মান রেকর্ডের ভিউ URL তৈরি করতে ব্যবহৃত হবে।

অনুসন্ধান ফলাফলের URL প্যারামিটারগুলি এস্কেপ করার জন্য url.columnsToEscape= movieId

ঐচ্ছিক। বৈধ ভিউ URL তৈরি করতে CSV কলামের নামগুলির মান URL হবে।

৭. মেটাডেটা, কলাম ফর্ম্যাট এবং অনুসন্ধানের মান নির্দিষ্ট করুন

আপনি কনফিগারেশন ফাইলে এমন প্যারামিটার যোগ করতে পারেন যা নির্দিষ্ট করে:

মেটাডেটা কনফিগারেশন প্যারামিটার

এই প্যারামিটারগুলি আইটেম মেটাডেটা পূরণ করার জন্য কলামগুলি বর্ণনা করে।

বিন্যাস প্যারামিটার
শিরোনাম itemMetadata.title.field= movieTitle
itemMetadata.title.defaultValue= Gone with the Wind

ডকুমেন্টের শিরোনামের জন্য মেটাডেটা অ্যাট্রিবিউট। ডিফল্ট হল একটি খালি স্ট্রিং।

URL টি itemMetadata.sourceRepositoryUrl.field= url
itemMetadata.sourceRepositoryUrl.defaultValue= https://www.imdb.com/title/tt0031381/
সার্চ ফলাফলে ডকুমেন্ট URL-এর মেটাডেটা অ্যাট্রিবিউট।
টাইমস্ট্যাম্প তৈরি করা হয়েছে itemMetadata.createTime.field= releaseDate
itemMetadata.createTime.defaultValue= 1940-01-17

ডকুমেন্ট তৈরির টাইমস্ট্যাম্পের মেটাডেটা অ্যাট্রিবিউট।

শেষ সংশোধিত সময় itemMetadata.updateTime.field= releaseDate
itemMetadata.updateTime.defaultValue= 1940-01-17

ডকুমেন্টের শেষ পরিবর্তন টাইমস্ট্যাম্পের মেটাডেটা অ্যাট্রিবিউট।

নথির ভাষা itemMetadata.contentLanguage.field= languageCode
itemMetadata.contentLanguage.defaultValue= en-US

সূচীবদ্ধ করা হচ্ছে এমন নথির বিষয়বস্তুর ভাষা।

স্কিমা অবজেক্টের ধরণ itemMetadata.objectType.field= type
itemMetadata.objectType.defaultValue= movie

স্কিমায় সংজ্ঞায়িতভাবে, সংযোগকারী দ্বারা ব্যবহৃত বস্তুর ধরণ। এই বৈশিষ্ট্যটি নির্দিষ্ট না থাকলে সংযোগকারী কোনও স্ট্রাকচার্ড ডেটা সূচী করবে না।

তারিখ-সময় বিন্যাস

এই প্যারামিটারটি স্ট্রিং মানগুলিকে তারিখ বা তারিখ-সময় ক্ষেত্রে পার্স করার জন্য অতিরিক্ত তারিখ-সময় বিন্যাস নির্দিষ্ট করে।

বিন্যাস প্যারামিটার
অতিরিক্ত তারিখ-সময় বিন্যাস structuredData.dateTimePatterns= MM/dd/uuuu HH:mm:ssXXX
অতিরিক্ত java.time.format.DateTimeFormatter প্যাটার্নের একটি সেমিকোলন -বিচ্ছিন্ন তালিকা। মেটাডেটা বা স্কিমার যেকোনো তারিখ বা তারিখ-সময় ক্ষেত্রের জন্য স্ট্রিং মান পার্স করার সময় প্যাটার্নগুলি ব্যবহার করা হয়। ডিফল্ট মান হল একটি খালি তালিকা, তবে RFC 3339 এবং RFC 1123 ফর্ম্যাট সর্বদা সমর্থিত।

কলামের ফর্ম্যাট

এই প্যারামিটারগুলি CSV ফাইলে কলামগুলি কীভাবে পার্স করতে হয় তা নির্দিষ্ট করে।

বিন্যাস প্যারামিটার
হেডার এড়িয়ে যান csv.skipHeaderRecord=true

প্রথম লাইনটি উপেক্ষা করুন। ডিফল্ট হল মিথ্যা।

বহু-মান কলাম csv.multiValueColumns= genre,actors

একাধিক মান সহ কলামের নাম।

বহু-মান কলামের জন্য ডিলিমিটার csv.multiValue.genre= ;

বহু-মান কলামের জন্য ডিলিমিটার। ডিফল্ট ডিলিমিটার হল একটি কমা।

অনুসন্ধানের মান

রেকর্ড ফরম্যাট করার জন্য সংযোগকারীটি একটি কন্টেন্ট টেমপ্লেট ব্যবহার করে। শিরোনাম ক্ষেত্রের অগ্রাধিকার সর্বোচ্চ। আপনি অন্যান্য ক্ষেত্রে অগ্রাধিকার স্তর (উচ্চ, মাঝারি, নিম্ন) নির্ধারণ করতে পারেন।

বিন্যাস প্যারামিটার
কন্টেন্টের শিরোনাম contentTemplate.csv.title= movieTitle

কন্টেন্টের শিরোনাম হল সর্বোচ্চ অনুসন্ধান মানের ক্ষেত্র।

কন্টেন্ট ফিল্ডের জন্য উচ্চ মানের অনুসন্ধান contentTemplate.csv.quality.high= actors

কন্টেন্ট ফিল্ডগুলিতে উচ্চ অনুসন্ধান মানের মান দেওয়া হয়। ডিফল্ট হিসেবে একটি খালি স্ট্রিং ব্যবহার করা হয়।

কন্টেন্ট ফিল্ডের জন্য নিম্নমানের সার্চ কোয়ালিটি contentTemplate.csv.quality.low= genre

কন্টেন্ট ফিল্ডগুলিতে সার্চের মানের মান কম। ডিফল্ট হিসেবে একটি খালি স্ট্রিং ব্যবহার করা হয়।

কন্টেন্ট ফিল্ডের জন্য মাঝারি সার্চ কোয়ালিটি contentTemplate.csv.quality.medium= description

কন্টেন্ট ফিল্ডগুলিতে একটি মাঝারি অনুসন্ধান মানের মান দেওয়া হয়। ডিফল্ট হিসেবে একটি খালি স্ট্রিং ব্যবহার করা হয়।

অনির্দিষ্ট কন্টেন্ট ক্ষেত্র contentTemplate.csv.unmappedColumnsMode= IGNORE

সংযোগকারী কীভাবে অনির্দিষ্ট কন্টেন্ট ক্ষেত্রগুলি পরিচালনা করে। বৈধ মানগুলি হল:

  • APPEND — টেমপ্লেটে অনির্দিষ্ট কন্টেন্ট ফিল্ড যোগ করুন
  • উপেক্ষা করুন — অনির্দিষ্ট কন্টেন্ট ক্ষেত্রগুলি উপেক্ষা করুন

ডিফল্ট মান হল APPEND।

৮. ডেটা ট্রাভার্সালের সময়সূচী নির্ধারণ করুন

ট্র্যাভার্সাল হলো কন্টেন্ট আবিষ্কারের প্রক্রিয়া। সংযোগকারীটি CSV সারি অতিক্রম করে এবং Indexing API ব্যবহার করে সেগুলিকে সূচীবদ্ধ করে। CSV সংযোগকারী শুধুমাত্র সম্পূর্ণ ট্র্যাভার্সাল সম্পাদন করে।

বিন্যাস প্যারামিটার
ট্রাভার্সাল ব্যবধান schedule.traversalIntervalSecs = 7200

সম্পূর্ণ ট্রাভার্সালের মধ্যে ব্যবধান সেকেন্ডে। ডিফল্ট হল 86400 (এক দিন)।

স্টার্টআপে ট্র্যাভার্সাল schedule.performTraversalOnStart = false

প্রথম ব্যবধানের মেয়াদ শেষ হওয়ার অপেক্ষা করার পরিবর্তে, সংযোগকারীটি সংযোগকারী শুরুতে একটি ট্র্যাভার্সাল সম্পাদন করে। ডিফল্ট হল true.

৯. ACL বিকল্পগুলি নির্দিষ্ট করুন

সংযোগকারীটি অ্যাক্সেস নিয়ন্ত্রণ করতে ACL ব্যবহার করে। যদি আপনার সংগ্রহস্থল ACL সরবরাহ করে, তাহলে সেগুলি আপলোড করুন। অন্যথায়, ডিফল্ট ACL কনফিগার করুন। defaultAcl.mode none ব্যতীত অন্য একটি মানে সেট করুন।

বিন্যাস প্যারামিটার
ACL মোড defaultAcl.mode =fallback

প্রয়োজনীয়। সংযোগকারীটি শুধুমাত্র ফলব্যাক মোড সমর্থন করে।

ডিফল্ট ACL নাম ডিফল্টAcl.name = VIRTUAL_CONTAINER_FOR_CONNECTOR_1

ঐচ্ছিক। ডিফল্ট ACL-এর জন্য সংযোগকারী দ্বারা ব্যবহৃত ভার্চুয়াল কন্টেইনার নামটি ওভাররাইড করে। ডিফল্ট মান হল DEFAULT_ACL_VIRTUAL_CONTAINER । যদি একাধিক সংযোগকারী একই ডেটা উৎসে কন্টেন্ট ইন্ডেক্স করে তবে এটি ওভাররাইড করার কথা বিবেচনা করুন।

ডিফল্ট পাবলিক ACL defaultAcl.public = true

সম্পূর্ণ রিপোজিটরিটিকে পাবলিক ডোমেইন অ্যাক্সেসে সেট করে। ডিফল্ট হল মিথ্যা।

সাধারণ ACL গ্রুপ পাঠক defaultAcl.readers.groups = google: group1, group2
সাধারণ ACL পাঠক defaultAcl.readers.users = user1, user2, google: user3
কমন এসিএল গ্রুপ রিডারদের অস্বীকার করেছে defaultAcl.denied.groups = group3
কমন এসিএল অস্বীকৃত পাঠক defaultAcl.denied.users = user4, user5
সম্পূর্ণ ডোমেন অ্যাক্সেস ডোমেনের প্রতিটি ব্যবহারকারীর দ্বারা প্রতিটি ইনডেক্স করা রেকর্ড সর্বজনীনভাবে অ্যাক্সেসযোগ্য তা নির্দিষ্ট করতে, নিম্নলিখিত দুটি বিকল্পকে মান সহ সেট করুন:
  • defaultAcl.mode =fallback
  • defaultAcl.public =true
সাধারণ সংজ্ঞায়িত ACL প্রতিটি রেকর্ডের জন্য একটি সাধারণ ACL সংজ্ঞায়িত করতে, নিম্নলিখিত পরামিতিগুলি সেট করুন:
  • defaultAcl.mode =fallback
  • defaultAcl.public =false
  • defaultAcl.readers.groups = google: group1, group2
  • defaultAcl.readers.users = user1, user2, google: user3
  • defaultAcl.denied.groups = group3
  • defaultAcl.denied.users = user4, user5

ব্যবহারকারী এবং গোষ্ঠীগুলিকে স্থানীয় ডোমেইন-সংজ্ঞায়িত বলে ধরে নেওয়া হয় যদি না " google: " এর সাথে পূর্বে যুক্ত করা হয়।

ডিফল্ট ব্যবহারকারী বা গোষ্ঠী একটি খালি স্ট্রিং। defaultAcl.public যদি false হয় তবে শুধুমাত্র ব্যবহারকারী এবং গোষ্ঠী বিকল্পগুলি সরবরাহ করুন। একাধিক গোষ্ঠী এবং ব্যবহারকারীর জন্য কমা দ্বারা বিভক্ত তালিকা ব্যবহার করুন।

যদি defaultAcl.mode none হয়, তাহলে পৃথক ACL ছাড়া রেকর্ডগুলি অনুসন্ধান করা যাবে না।

স্কিমা সংজ্ঞা

স্ট্রাকচার্ড ডেটা কোয়েরি সমর্থন করতে, আপনার ডেটা সোর্সের জন্য একটি স্কিমা সেট আপ করুন

উদাহরণস্বরূপ, সিনেমা সম্পর্কে নিম্নলিখিত তথ্য সহ একটি CSV ফাইল বিবেচনা করুন:

  1. মুভি আইডি
  2. মুভিটাইটেল
  3. বর্ণনা
  4. বছর
  5. মুক্তির তারিখ
  6. অভিনেতা (কমা (,) দ্বারা পৃথক করা একাধিক মান)
  7. ধরণ (একাধিক মান)
  8. রেটিং

এই কাঠামোর উপর ভিত্তি করে, আপনি আপনার ডেটা উৎসের জন্য নিম্নলিখিত স্কিমা সংজ্ঞায়িত করতে পারেন:

{
  "objectDefinitions": [
    {
      "name": "movie",
      "propertyDefinitions": [
        {
          "name": "actors",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "textPropertyOptions": {
            "operatorOptions": {
              "operatorName": "actor"
            }
          }
        },
        {
          "name": "releaseDate",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "datePropertyOptions": {
            "operatorOptions": {
              "operatorName": "released",
              "lessThanOperatorName": "releasedbefore",
              "greaterThanOperatorName": "releasedafter"
            }
          }
        },
        {
          "name": "movieTitle",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": false,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": "HIGHEST"
            },
            "operatorOptions": {
              "operatorName": "title"
            }
          }
        },
        {
          "name": "genre",
          "isReturnable": true,
          "isRepeatable": true,
          "isFacetable": true,
          "enumPropertyOptions": {
            "operatorOptions": {
              "operatorName": "genre"
            },
            "possibleValues": [
              {
                "stringValue": "Action"
              },
              {
                "stringValue": "Documentary"
              },
              {
                "stringValue": "Drama"
              },
              {
                "stringValue": "Crime"
              },
              {
                "stringValue": "Sci-fi"
              }
            ]
          }
        },
        {
          "name": "userRating",
          "isReturnable": true,
          "isRepeatable": false,
          "isFacetable": true,
          "integerPropertyOptions": {
            "orderedRanking": "ASCENDING",
            "maximumValue": "10",
            "operatorOptions": {
              "operatorName": "score",
              "lessThanOperatorName": "scorebelow",
              "greaterThanOperatorName": "scoreabove"
            }
          }
        }
      ]
    }
  ]
}

উদাহরণ কনফিগারেশন ফাইল

নিম্নলিখিত উদাহরণ কনফিগারেশন ফাইলটি প্যারামিটার key=value জোড়া দেখায় যা একটি উদাহরণ সংযোগকারীর আচরণ সংজ্ঞায়িত করে।

# data source access
api.sourceId=1234567890abcd
api.serviceAccountPrivateKeyFile=./PrivateKey.json

# CSV data structure
csv.filePath=./movie_content.csv
csv.csvColumns=movieId,movieTitle,description,releaseYear,genre,actors,ratings,releaseDate
csv.skipHeaderRecord=true
url.format=https://mymoviesite.com/movies/{0}
url.columns=movieId
csv.datetimeFormat.releaseDate=yyyy-mm-dd
csv.multiValueColumns=genre,actors
csv.multiValue.genre=;
contentTemplate.csv.title=movieTitle

# metadata structured data and content
itemMetadata.title.field=movieTitle
itemMetadata.createTime.field=releaseDate
itemMetadata.contentLanguage.defaultValue=en-US
itemMetadata.objectType.defaultValue=movie
contentTemplate.csv.quality.medium=description
contentTemplate.csv.unmappedColumnsMode=IGNORE

#ACLs
defaultAcl.mode=fallback
defaultAcl.public=true

সংযোগকারীটি চালান

কমান্ড লাইন থেকে সংযোগকারীটি চালানোর জন্য:

$ java -jar google-cloudsearch-csv-connector-v1-0.0.3.jar -Dconfig=my.config

ডিফল্টরূপে, স্ট্যান্ডার্ড আউটপুটে সংযোগকারী লগগুলি উপলব্ধ থাকে। আপনি logging.properties নির্দিষ্ট করে ফাইলগুলিতে লগ করতে পারেন।