দ্রুত মানের মূল্যায়ন করুন

প্রম্পট এপিআই বাস্তবায়নের সময় আপনার প্রম্পটের মান এবং নির্ভরযোগ্যতা নিশ্চিত করা অত্যন্ত গুরুত্বপূর্ণ।

আপনার প্রম্পটের মান মূল্যায়ন করার জন্য, আপনার ব্যবহারের ক্ষেত্রে ইনপুট এবং প্রত্যাশিত আউটপুটগুলির একটি বিস্তৃত সেট তৈরি করা উচিত।

প্রতিটি জেমিনি ন্যানো মডেল সংস্করণের সাথে আপনার প্রম্পট আপনার মানের মান পূরণ করে কিনা তা মূল্যায়ন করার জন্য, আমরা নিম্নলিখিত কর্মপ্রবাহের সুপারিশ করছি:

  1. আপনার মূল্যায়ন ডেটাসেট চালান এবং আউটপুট রেকর্ড করুন।
  2. ফলাফলগুলি ম্যানুয়ালি মূল্যায়ন করুন অথবা LLM-as-a-judge ব্যবহার করুন।
    1. যদি মূল্যায়ন আপনার মানের মান পূরণ না করে, তাহলে আপনার প্রম্পটে পুনরাবৃত্তি করুন। উদাহরণস্বরূপ, জেমিনি প্রো-এর মতো আরও শক্তিশালী LLM-কে প্রকৃত আউটপুটের তুলনায় পছন্দসই আউটপুটের উপর ভিত্তি করে প্রম্পট উন্নত করতে বলুন।

প্রম্পট ইঞ্জিনিয়ারিং কাজের কর্মক্ষমতা বৃদ্ধি করে, এবং আপনার প্রম্পটগুলিতে পুনরাবৃত্তি করা গুরুত্বপূর্ণ। আমরা উপরের ধাপগুলিতে কমপক্ষে 3-5টি পুনরাবৃত্তি করার পরামর্শ দিই। মনে রাখবেন যে এই পদ্ধতির সীমাবদ্ধতা রয়েছে, কারণ অপ্টিমাইজেশনগুলি অবশেষে হ্রাসকারী রিটার্ন প্রদান করবে।

বিকল্পভাবে, স্কেলে দ্রুত প্রম্পট উন্নত করতে, আপনি ডেটা-চালিত অপ্টিমাইজার ব্যবহার করতে পারেন, যা gemma-3n-e4b-it মতো ডিভাইসের মডেলগুলিকে লক্ষ্য করতে পারে।

নিরাপত্তা

জেমিনি ন্যানো ব্যবহারকারীদের জন্য নিরাপদ ফলাফল প্রদান নিশ্চিত করতে, ক্ষতিকারক বা অনিচ্ছাকৃত ফলাফল সীমিত করার জন্য একাধিক স্তরের সুরক্ষা প্রয়োগ করা হয়েছে:

  • নেটিভ মডেলের নিরাপত্তা : জেমিনি ন্যানো সহ সমস্ত জেমিনি মডেলকে নিরাপত্তার বিষয়ে সচেতন থাকার জন্য প্রশিক্ষিত করা হয়েছে। এর অর্থ হল নিরাপত্তার বিবেচনাগুলি মডেলের মূল অংশে অন্তর্ভুক্ত করা হয়েছে, কেবল পরবর্তী চিন্তাভাবনা হিসাবে যুক্ত করা হয়নি।
  • ইনপুট এবং আউটপুট সংক্রান্ত সুরক্ষা ফিল্টার : জেমিনি ন্যানো রানটাইম দ্বারা উৎপন্ন ইনপুট প্রম্পট এবং ফলাফল উভয়ই অ্যাপে ফলাফল সরবরাহ করার আগে আমাদের সুরক্ষা ফিল্টারগুলির সাথে মূল্যায়ন করা হয়। এটি মানের কোনও ক্ষতি ছাড়াই অনিরাপদ সামগ্রীকে পিছলে যাওয়া থেকে রক্ষা করতে সহায়তা করে।

তবে, যেহেতু প্রতিটি অ্যাপের ব্যবহারকারীদের জন্য কোন বিষয়বস্তু নিরাপদ বলে বিবেচিত হবে তার নিজস্ব মানদণ্ড রয়েছে, তাই আপনার অ্যাপের নির্দিষ্ট ব্যবহারের ক্ষেত্রে নিরাপত্তা ঝুঁকিগুলি মূল্যায়ন করা উচিত এবং সেই অনুযায়ী পরীক্ষা করা উচিত।

অতিরিক্ত সম্পদ