এই পৃষ্ঠায় জেনারেটিভ এআই শব্দকোষ রয়েছে। সকল শব্দকোষের জন্য এখানে ক্লিক করুন ।
ক
স্বয়ংক্রিয় মূল্যায়ন
একটি মডেলের আউটপুট গুণমান বিচার করতে সফ্টওয়্যার ব্যবহার করে.
যখন মডেল আউটপুট তুলনামূলকভাবে সহজবোধ্য হয়, তখন একটি স্ক্রিপ্ট বা প্রোগ্রাম মডেলের আউটপুটকে সোনালী প্রতিক্রিয়ার সাথে তুলনা করতে পারে। এই ধরনের স্বয়ংক্রিয় মূল্যায়নকে কখনও কখনও প্রোগ্রামেটিক মূল্যায়ন বলা হয়। মেট্রিক্স যেমন ROUGE বা BLEU প্রায়ই প্রোগ্রামেটিক মূল্যায়নের জন্য উপযোগী।
যখন মডেল আউটপুট জটিল হয় বা এর কোনো সঠিক উত্তর থাকে না , তখন একটি স্বয়ংক্রিয় এমএল প্রোগ্রাম নামে পরিচিত একটি স্বয়ংক্রিয় মূল্যায়ন করে।
মানুষের মূল্যায়নের সাথে বৈসাদৃশ্য।
অটোরাটার মূল্যায়ন
একটি জেনারেটিভ এআই মডেলের আউটপুটের গুণমান বিচার করার জন্য একটি হাইব্রিড প্রক্রিয়া যা মানুষের মূল্যায়নকে স্বয়ংক্রিয় মূল্যায়নের সাথে একত্রিত করে। একটি অটোরাটার হল একটি এমএল মডেল যা মানুষের মূল্যায়ন দ্বারা তৈরি ডেটার উপর প্রশিক্ষিত। আদর্শভাবে, একজন অটোরাটার একজন মানুষের মূল্যায়নকারীকে অনুকরণ করতে শেখে।প্রি-বিল্ট অটোরেটর উপলব্ধ, তবে সেরা অটোরেটরগুলি বিশেষভাবে আপনি যে কাজটি মূল্যায়ন করছেন তার জন্য সূক্ষ্ম সুর করা হয়।
অটো রিগ্রেসিভ মডেল
একটি মডেল যা তার নিজের পূর্বের ভবিষ্যদ্বাণীগুলির উপর ভিত্তি করে একটি ভবিষ্যদ্বাণী অনুমান করে৷ উদাহরণস্বরূপ, অটো-রিগ্রেসিভ ল্যাঙ্গুয়েজ মডেলগুলি পূর্বে ভবিষ্যদ্বাণী করা টোকেনের উপর ভিত্তি করে পরবর্তী টোকেনের পূর্বাভাস দেয়। সমস্ত ট্রান্সফরমার -ভিত্তিক বৃহৎ ভাষার মডেলগুলি স্বয়ংক্রিয়-রিগ্রেসিভ।
বিপরীতে, GAN- ভিত্তিক ইমেজ মডেলগুলি সাধারণত অটো-রিগ্রেসিভ হয় না কারণ তারা একটি একক ফরোয়ার্ড-পাসে একটি ছবি তৈরি করে এবং ধাপে ধাপে নয়। যাইহোক, কিছু ইমেজ জেনারেশন মডেল অটো-রিগ্রেসিভ কারণ তারা ধাপে ধাপে একটি ইমেজ তৈরি করে।
গ
চেইন-অফ-থট প্রম্পটিং
একটি প্রম্পট ইঞ্জিনিয়ারিং কৌশল যা একটি বৃহৎ ভাষা মডেল (LLM) কে ধাপে ধাপে তার যুক্তি ব্যাখ্যা করতে উৎসাহিত করে। উদাহরণস্বরূপ, দ্বিতীয় বাক্যে বিশেষ মনোযোগ দিয়ে নিম্নলিখিত প্রম্পটটি বিবেচনা করুন:
7 সেকেন্ডে প্রতি ঘন্টায় 0 থেকে 60 মাইল বেগে যাওয়া গাড়িতে একজন চালক কতটি জি ফোর্স অনুভব করবে? উত্তরে, সমস্ত প্রাসঙ্গিক গণনা দেখান।
এলএলএম এর প্রতিক্রিয়া সম্ভবত:
- উপযুক্ত স্থানে 0, 60, এবং 7 মান প্লাগ করে পদার্থবিজ্ঞানের সূত্রের একটি ক্রম দেখান।
- ব্যাখ্যা করুন কেন এটি সেই সূত্রগুলি বেছে নিয়েছে এবং বিভিন্ন ভেরিয়েবলের অর্থ কী।
চেইন-অফ-থট প্রম্পটিং এলএলএমকে সমস্ত গণনা সম্পাদন করতে বাধ্য করে, যা আরও সঠিক উত্তরের দিকে নিয়ে যেতে পারে। উপরন্তু, চেইন-অফ-থট প্রম্পটিং ব্যবহারকারীকে LLM-এর পদক্ষেপগুলি পরীক্ষা করতে সক্ষম করে উত্তরটি অর্থপূর্ণ কিনা তা নির্ধারণ করতে।
চ্যাট
একটি ML সিস্টেমের সাথে একটি পিছনে এবং সামনে কথোপকথনের বিষয়বস্তু, সাধারণত একটি বড় ভাষা মডেল । একটি চ্যাটে পূর্ববর্তী মিথস্ক্রিয়া (আপনি কী টাইপ করেছেন এবং কীভাবে বৃহৎ ভাষার মডেল প্রতিক্রিয়া জানিয়েছেন) চ্যাটের পরবর্তী অংশগুলির প্রসঙ্গ হয়ে ওঠে।
একটি চ্যাটবট একটি বড় ভাষা মডেলের একটি অ্যাপ্লিকেশন।
প্রাসঙ্গিক ভাষা এম্বেডিং
একটি এমবেডিং যা শব্দ এবং বাক্যাংশগুলিকে "বোঝার" কাছাকাছি আসে যেভাবে সাবলীল মানুষের বক্তারা করতে পারেন। প্রাসঙ্গিক ভাষা এম্বেডিং জটিল বাক্য গঠন, শব্দার্থবিদ্যা এবং প্রসঙ্গ বুঝতে পারে।
উদাহরণস্বরূপ, ইংরেজি শব্দ cow এর এমবেডিং বিবেচনা করুন। পুরানো এম্বেডিং যেমন word2vec ইংরেজি শব্দগুলিকে উপস্থাপন করতে পারে যেমন গাভী থেকে ষাঁড় পর্যন্ত এম্বেড করার স্থানের দূরত্ব ewe (স্ত্রী ভেড়া) থেকে রাম (পুরুষ ভেড়া) বা মহিলা থেকে পুরুষের দূরত্বের সমান। প্রাসঙ্গিক ভাষা এম্বেডিংগুলি স্বীকার করে আরও এক ধাপ এগিয়ে যেতে পারে যে ইংরেজি ভাষাভাষীরা কখনও কখনও গরু বা ষাঁড়ের অর্থ বোঝাতে গরু শব্দটি ব্যবহার করে।
প্রসঙ্গ উইন্ডো
প্রদত্ত প্রম্পটে একটি মডেল প্রক্রিয়া করতে পারে এমন টোকেনের সংখ্যা। প্রসঙ্গ উইন্ডো যত বড় হবে, মডেলটি প্রম্পটে সুসংগত এবং সামঞ্জস্যপূর্ণ প্রতিক্রিয়া প্রদান করতে তত বেশি তথ্য ব্যবহার করতে পারে।
ডি
সরাসরি প্রম্পটিং
জিরো-শট প্রম্পটিং- এর প্রতিশব্দ।
পাতন
একটি মডেলের আকার ( শিক্ষক হিসাবে পরিচিত) একটি ছোট মডেলে (যা ছাত্র হিসাবে পরিচিত) হ্রাস করার প্রক্রিয়া যা যথাসম্ভব বিশ্বস্ততার সাথে আসল মডেলের ভবিষ্যদ্বাণীগুলিকে অনুকরণ করে৷ পাতন কার্যকর কারণ ছোট মডেলের বড় মডেলের (শিক্ষক) তুলনায় দুটি মূল সুবিধা রয়েছে:
- দ্রুত অনুমান সময়
- স্মৃতিশক্তি এবং শক্তির ব্যবহার হ্রাস
যাইহোক, ছাত্রের ভবিষ্যদ্বাণীগুলি সাধারণত শিক্ষকের ভবিষ্যদ্বাণীগুলির মতো ভাল হয় না।
ডিস্টিলেশন শিক্ষার্থী এবং শিক্ষক মডেলের ভবিষ্যদ্বাণীগুলির আউটপুটগুলির মধ্যে পার্থক্যের উপর ভিত্তি করে ক্ষতির কার্যকারিতা কমাতে ছাত্র মডেলকে প্রশিক্ষণ দেয়।
নিম্নোক্ত পদগুলির সাথে পাতনের তুলনা করুন এবং বৈসাদৃশ্য করুন:
আরও তথ্যের জন্য এলএলএম দেখুন: মেশিন লার্নিং ক্র্যাশ কোর্সে ফাইন-টিউনিং, ডিস্টিলেশন এবং প্রম্পট ইঞ্জিনিয়ারিং ।
ই
evas
প্রাথমিকভাবে এলএলএম মূল্যায়নের সংক্ষিপ্ত রূপ হিসাবে ব্যবহৃত হয়। আরও বিস্তৃতভাবে, ইভাল হল যেকোনো ধরনের মূল্যায়নের সংক্ষিপ্ত রূপ।
মূল্যায়ন
একটি মডেলের গুণমান পরিমাপ করার বা একে অপরের সাথে বিভিন্ন মডেলের তুলনা করার প্রক্রিয়া।
একটি তত্ত্বাবধানে থাকা মেশিন লার্নিং মডেলের মূল্যায়ন করতে, আপনি সাধারণত এটিকে একটি বৈধতা সেট এবং একটি পরীক্ষা সেটের বিপরীতে বিচার করেন। একটি LLM মূল্যায়ন সাধারণত বিস্তৃত গুণমান এবং নিরাপত্তা মূল্যায়ন জড়িত।
চ
বাস্তবতা
এমএল বিশ্বের মধ্যে, এমন একটি সম্পত্তি যা একটি মডেল বর্ণনা করে যার আউটপুট বাস্তবতার উপর ভিত্তি করে। বাস্তবতা একটি মেট্রিকের পরিবর্তে একটি ধারণা। উদাহরণস্বরূপ, ধরুন আপনি একটি বড় ভাষা মডেলে নিম্নলিখিত প্রম্পট পাঠান:
টেবিল লবণের রাসায়নিক সূত্র কি?
বাস্তবতা অপ্টিমাইজ করে একটি মডেল সাড়া দেবে:
NaCl
এটা অনুমান করতে প্রলুব্ধ হয় যে সমস্ত মডেল বাস্তবতার উপর ভিত্তি করে হওয়া উচিত। যাইহোক, কিছু প্রম্পট, যেমন নিম্নলিখিত, একটি জেনারেটিভ এআই মডেলকে বাস্তবতার পরিবর্তে সৃজনশীলতাকে অপ্টিমাইজ করতে বাধ্য করা উচিত।
আমাকে একজন মহাকাশচারী এবং একটি শুঁয়োপোকা সম্পর্কে একটি লিমেরিক বলুন।
এটি অসম্ভাব্য যে ফলস্বরূপ লিমেরিক বাস্তবতার উপর ভিত্তি করে হবে।
স্থলতার সাথে বৈসাদৃশ্য।
কয়েক শট প্রম্পটিং
একটি প্রম্পট যাতে একাধিক (একটি "কয়েক") উদাহরণ রয়েছে যা প্রদর্শন করে যে কীভাবে বড় ভাষা মডেলের প্রতিক্রিয়া জানানো উচিত। উদাহরণস্বরূপ, নিম্নলিখিত দীর্ঘ প্রম্পটে দুটি উদাহরণ রয়েছে যা একটি বৃহৎ ভাষার মডেল দেখাচ্ছে কিভাবে একটি প্রশ্নের উত্তর দিতে হয়।
এক প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কি? | যে প্রশ্নটির উত্তর আপনি LLM করতে চান। |
ফ্রান্স: EUR | একটি উদাহরণ. |
যুক্তরাজ্য: GBP | আরেকটি উদাহরণ। |
ভারত: | প্রকৃত প্রশ্ন. |
কিছু-শট প্রম্পটিং সাধারণত জিরো-শট প্রম্পটিং এবং ওয়ান-শট প্রম্পটিংয়ের চেয়ে বেশি পছন্দসই ফলাফল দেয়। যাইহোক, অল্প-শট প্রম্পটিংয়ের জন্য একটি দীর্ঘ প্রম্পট প্রয়োজন।
ফিউ-শট প্রম্পটিং হল প্রম্পট-ভিত্তিক শিক্ষার জন্য প্রয়োগ করা কয়েক-শট লার্নিংয়ের একটি রূপ।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে প্রম্পট ইঞ্জিনিয়ারিং দেখুন।
ফাইন-টিউনিং
একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে এর পরামিতিগুলিকে পরিমার্জিত করার জন্য একটি প্রাক-প্রশিক্ষিত মডেলে একটি দ্বিতীয়, টাস্ক-নির্দিষ্ট প্রশিক্ষণ পাস। উদাহরণস্বরূপ, কিছু বড় ভাষা মডেলের জন্য সম্পূর্ণ প্রশিক্ষণের ক্রম নিম্নরূপ:
- প্রাক-প্রশিক্ষণ: একটি বিশাল সাধারণ ডেটাসেটে একটি বৃহৎ ভাষার মডেলকে প্রশিক্ষণ দিন, যেমন সমস্ত ইংরেজি ভাষার উইকিপিডিয়া পৃষ্ঠা।
- ফাইন-টিউনিং: একটি নির্দিষ্ট কাজ করার জন্য প্রাক-প্রশিক্ষিত মডেলকে প্রশিক্ষণ দিন, যেমন মেডিকেল প্রশ্নের উত্তর দেওয়া। ফাইন-টিউনিংয়ে সাধারণত নির্দিষ্ট কাজের উপর দৃষ্টি নিবদ্ধ করে শত শত বা হাজার হাজার উদাহরণ জড়িত থাকে।
আরেকটি উদাহরণ হিসাবে, একটি বড় ইমেজ মডেলের জন্য সম্পূর্ণ প্রশিক্ষণের ক্রম নিম্নরূপ:
- প্রাক-প্রশিক্ষণ: একটি বিশাল সাধারণ ইমেজ ডেটাসেটে একটি বড় ইমেজ মডেলকে প্রশিক্ষণ দিন, যেমন উইকিমিডিয়া কমন্সের সমস্ত ছবি।
- ফাইন-টিউনিং: একটি নির্দিষ্ট কাজ সম্পাদন করার জন্য পূর্ব-প্রশিক্ষিত মডেলকে প্রশিক্ষণ দিন, যেমন অর্কাসের ছবি তৈরি করা।
ফাইন-টিউনিং নিম্নলিখিত কৌশলগুলির যেকোন সংমিশ্রণকে অন্তর্ভুক্ত করতে পারে:
- প্রাক-প্রশিক্ষিত মডেলের বিদ্যমান পরামিতিগুলির সমস্ত পরিবর্তন করা। একে কখনও কখনও ফুল ফাইন-টিউনিং বলা হয়।
- অন্যান্য বিদ্যমান পরামিতিগুলি অপরিবর্তিত রেখে (সাধারণত, ইনপুট স্তরের সবচেয়ে কাছের স্তরগুলি) রেখে শুধুমাত্র প্রাক-প্রশিক্ষিত মডেলের বিদ্যমান প্যারামিটারগুলির কিছু পরিবর্তন করা (সাধারণত, আউটপুট স্তরের নিকটতম স্তরগুলি)। প্যারামিটার-দক্ষ টিউনিং দেখুন।
- আরও স্তর যুক্ত করা হচ্ছে, সাধারণত আউটপুট স্তরের নিকটতম বিদ্যমান স্তরগুলির উপরে।
ফাইন-টিউনিং হল ট্রান্সফার লার্নিং এর একটি ফর্ম। যেমন, ফাইন-টিউনিং একটি ভিন্ন লস ফাংশন ব্যবহার করতে পারে বা প্রাক-প্রশিক্ষিত মডেলকে প্রশিক্ষিত করতে ব্যবহৃত মডেলের তুলনায় ভিন্ন মডেলের ধরন ব্যবহার করতে পারে। উদাহরণস্বরূপ, আপনি একটি রিগ্রেশন মডেল তৈরি করতে একটি প্রাক-প্রশিক্ষিত বড় ইমেজ মডেলকে সূক্ষ্ম-টিউন করতে পারেন যা একটি ইনপুট চিত্রে পাখির সংখ্যা ফেরত দেয়।
নিম্নলিখিত পদগুলির সাথে ফাইন-টিউনিং তুলনা করুন এবং বৈসাদৃশ্য করুন:
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ফাইন-টিউনিং দেখুন।
সাফল্যের ভগ্নাংশ
একটি ML মডেলের তৈরি করা পাঠ্য মূল্যায়নের জন্য একটি মেট্রিক৷ সাফল্যের ভগ্নাংশ হল "সফল" জেনারেট করা টেক্সট আউটপুটের সংখ্যাকে জেনারেট করা টেক্সট আউটপুটের মোট সংখ্যা দিয়ে ভাগ করা হয়। উদাহরণস্বরূপ, যদি একটি বড় ভাষা মডেল কোডের 10 টি ব্লক তৈরি করে, যার মধ্যে পাঁচটি সফল হয়, তাহলে সাফল্যের ভগ্নাংশ হবে 50%।
যদিও সাফল্যের ভগ্নাংশ পরিসংখ্যান জুড়ে বিস্তৃতভাবে কার্যকর, ML-এর মধ্যে, এই মেট্রিকটি প্রাথমিকভাবে কোড জেনারেশন বা গণিত সমস্যাগুলির মতো যাচাইযোগ্য কাজগুলি পরিমাপের জন্য দরকারী।
জি
মিথুন
Google-এর সবচেয়ে উন্নত AI সমন্বিত ইকোসিস্টেম। এই ইকোসিস্টেমের উপাদানগুলির মধ্যে রয়েছে:
- বিভিন্ন মিথুন মডেল ।
- মিথুন মডেলের ইন্টারেক্টিভ কথোপকথন ইন্টারফেস। ব্যবহারকারীরা প্রম্পট টাইপ করে এবং মিথুন সেই প্রম্পটে সাড়া দেয়।
- বিভিন্ন জেমিনি API
- মিথুন মডেলের উপর ভিত্তি করে বিভিন্ন ব্যবসায়িক পণ্য; উদাহরণস্বরূপ, গুগল ক্লাউডের জন্য মিথুন ।
মিথুন মডেল
গুগলের অত্যাধুনিক ট্রান্সফরমার -ভিত্তিক মাল্টিমডাল মডেল । মিথুন মডেলগুলি বিশেষভাবে এজেন্টদের সাথে সংহত করার জন্য ডিজাইন করা হয়েছে৷
ব্যবহারকারীরা মিথুন মডেলের সাথে ইন্টারেক্টিভ ডায়ালগ ইন্টারফেস এবং SDK-এর মাধ্যমে বিভিন্ন উপায়ে যোগাযোগ করতে পারে।
তৈরি করা পাঠ্য
সাধারণভাবে, একটি ML মডেল আউটপুট যে পাঠ্য. বৃহৎ ভাষার মডেলের মূল্যায়ন করার সময়, কিছু মেট্রিক্স উত্পন্ন পাঠ্যকে রেফারেন্স পাঠ্যের সাথে তুলনা করে। উদাহরণস্বরূপ, ধরুন আপনি একটি এমএল মডেল ফরাসি থেকে ডাচ ভাষায় কতটা কার্যকরভাবে অনুবাদ করে তা নির্ধারণ করার চেষ্টা করছেন। এই ক্ষেত্রে:
- জেনারেট করা পাঠ্য হল ডাচ অনুবাদ যা ML মডেল আউটপুট করে।
- রেফারেন্স টেক্সট হল ডাচ অনুবাদ যা একজন মানব অনুবাদক (বা সফ্টওয়্যার) তৈরি করে।
মনে রাখবেন কিছু মূল্যায়ন কৌশল রেফারেন্স টেক্সট জড়িত না.
জেনারেটিভ এআই
কোনো আনুষ্ঠানিক সংজ্ঞা ছাড়াই একটি উদীয়মান রূপান্তরমূলক ক্ষেত্র। এটি বলেছে, বেশিরভাগ বিশেষজ্ঞরা সম্মত হন যে জেনারেটিভ এআই মডেলগুলি নিম্নলিখিত সমস্ত সামগ্রী তৈরি করতে পারে ("উত্পন্ন"):
- জটিল
- সুসঙ্গত
- মূল
উদাহরণস্বরূপ, একটি জেনারেটিভ এআই মডেল পরিশীলিত প্রবন্ধ বা চিত্র তৈরি করতে পারে।
LSTMs এবং RNN সহ কিছু আগের প্রযুক্তিও আসল এবং সুসংগত বিষয়বস্তু তৈরি করতে পারে। কিছু বিশেষজ্ঞ এই আগের প্রযুক্তিগুলিকে জেনারেটিভ AI হিসাবে দেখেন, অন্যরা মনে করেন যে সত্যিকারের জেনারেটিভ AI-এর জন্য আগের প্রযুক্তিগুলি তৈরি করতে পারে তার চেয়ে আরও জটিল আউটপুট প্রয়োজন।
ভবিষ্যদ্বাণীমূলক ML এর সাথে বৈসাদৃশ্য।
সুবর্ণ প্রতিক্রিয়া
একটি উত্তর ভাল হতে পরিচিত. উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পট দেওয়া হয়েছে:
2 + 2
সুবর্ণ প্রতিক্রিয়া আশা করা যায়:
4
এইচ
মানুষের মূল্যায়ন
একটি প্রক্রিয়া যেখানে লোকেরা একটি এমএল মডেলের আউটপুটের গুণমান বিচার করে; উদাহরণস্বরূপ, দ্বিভাষিক লোকেদের একটি ML অনুবাদ মডেলের গুণমান বিচার করা। মানুষের মূল্যায়ন বিশেষ করে এমন মডেল বিচার করার জন্য উপযোগী যেগুলোর কোনো সঠিক উত্তর নেই।
স্বয়ংক্রিয় মূল্যায়ন এবং অটোরাটার মূল্যায়নের সাথে বৈসাদৃশ্য।
হিউম্যান ইন দ্য লুপ (HITL)
একটি ঢিলেঢালাভাবে সংজ্ঞায়িত বাগধারা যার অর্থ নিম্নলিখিত যে কোনো একটি হতে পারে:
- জেনারেটিভ এআই আউটপুটকে সমালোচনামূলক বা সন্দেহজনকভাবে দেখার নীতি। উদাহরণস্বরূপ, যারা এই ML শব্দকোষটি লেখেন তারা বৃহৎ ভাষার মডেলগুলি কী করতে পারে তা দেখে বিস্মিত হয় কিন্তু বৃহৎ ভাষার মডেলগুলি যে ভুলগুলি করে সে সম্পর্কে সচেতন।
- মানুষ একটি মডেলের আচরণকে আকৃতি, মূল্যায়ন এবং পরিমার্জন করতে সাহায্য করে তা নিশ্চিত করার জন্য একটি কৌশল বা সিস্টেম। একজন মানুষকে লুপের মধ্যে রাখা একটি AI কে মেশিন বুদ্ধিমত্তা এবং মানুষের বুদ্ধিমত্তা উভয় থেকে উপকৃত করতে সক্ষম করে। উদাহরণস্বরূপ, একটি সিস্টেম যেখানে একটি AI কোড তৈরি করে যা সফ্টওয়্যার ইঞ্জিনিয়াররা তারপর পর্যালোচনা করে একটি মানব-ইন-লুপ সিস্টেম।
আমি
প্রেক্ষাপটে শিক্ষা
কয়েক শট প্রম্পটিং এর সমার্থক।
নির্দেশ টিউনিং
ফাইন-টিউনিংয়ের একটি ফর্ম যা নির্দেশাবলী অনুসরণ করার জন্য একটি জেনারেটিভ এআই মডেলের ক্ষমতাকে উন্নত করে। ইন্সট্রাকশন টিউনিং এর মধ্যে একটি মডেলকে নির্দেশনা প্রম্পটের একটি সিরিজের প্রশিক্ষণ দেওয়া হয়, সাধারণত বিভিন্ন ধরনের কাজ কভার করে। ফলস্বরূপ নির্দেশ-সুরিত মডেলটি বিভিন্ন ধরনের কাজ জুড়ে জিরো-শট প্রম্পটে দরকারী প্রতিক্রিয়া তৈরি করে।
এর সাথে তুলনা এবং বৈসাদৃশ্য:
এল
এলএলএম
বড় ভাষার মডেলের সংক্ষিপ্ত রূপ।
এলএলএম মূল্যায়ন (ইভাল)
বড় ভাষা মডেল (LLMs) এর কর্মক্ষমতা মূল্যায়ন করার জন্য মেট্রিক্স এবং বেঞ্চমার্কের একটি সেট। উচ্চ স্তরে, এলএলএম মূল্যায়ন:
- এলএলএম-এর উন্নতি প্রয়োজন এমন ক্ষেত্রগুলি চিহ্নিত করতে গবেষকদের সাহায্য করুন।
- বিভিন্ন এলএলএম তুলনা করতে এবং একটি নির্দিষ্ট কাজের জন্য সেরা এলএলএম সনাক্ত করতে কার্যকর।
- LLM গুলি নিরাপদ এবং ব্যবহারের জন্য নৈতিক তা নিশ্চিত করতে সাহায্য করুন৷
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে বড় ভাষা মডেল (এলএলএম) দেখুন।
LoRA
নিম্ন-র্যাঙ্ক অভিযোজনযোগ্যতার সংক্ষিপ্ত রূপ।
নিম্ন-র্যাঙ্ক অভিযোজনযোগ্যতা (LoRA)
সূক্ষ্ম টিউনিংয়ের জন্য একটি প্যারামিটার-দক্ষ কৌশল যা মডেলের প্রাক-প্রশিক্ষিত ওজনগুলিকে "হিমায়িত" করে (যেমন সেগুলি আর পরিবর্তন করা যায় না) এবং তারপরে মডেলের মধ্যে প্রশিক্ষণযোগ্য ওজনের একটি ছোট সেট সন্নিবেশ করায়। প্রশিক্ষণযোগ্য ওজনের এই সেটটি ("আপডেট ম্যাট্রিক্স" নামেও পরিচিত) বেস মডেলের তুলনায় যথেষ্ট ছোট এবং তাই প্রশিক্ষন করা অনেক দ্রুত।
LoRA নিম্নলিখিত সুবিধা প্রদান করে:
- ডোমেনের জন্য একটি মডেলের ভবিষ্যদ্বাণীর গুণমান উন্নত করে যেখানে সূক্ষ্ম টিউনিং প্রয়োগ করা হয়।
- একটি মডেলের সমস্ত প্যারামিটার সূক্ষ্ম-টিউন করার প্রয়োজন হয় এমন কৌশলগুলির চেয়ে দ্রুত ফাইন-টিউন।
- একই বেস মডেল ভাগ করে নেওয়া একাধিক বিশেষ মডেলের একযোগে পরিবেশন সক্ষম করে অনুমানের গণনামূলক খরচ হ্রাস করে।
এম
মেশিন অনুবাদ
একটি মানুষের ভাষা থেকে অন্য মানুষের ভাষায় পাঠ্য রূপান্তর করতে সফ্টওয়্যার (সাধারণত, একটি মেশিন লার্নিং মডেল) ব্যবহার করে, উদাহরণস্বরূপ, ইংরেজি থেকে জাপানি ভাষায়।
গড় নির্ভুলতা k এ গড় (mAP@k)
একটি বৈধতা ডেটাসেট জুড়ে k স্কোরে সমস্ত গড় নির্ভুলতার পরিসংখ্যানগত গড়। k-এ গড় গড় নির্ভুলতার একটি ব্যবহার হল একটি সুপারিশ সিস্টেম দ্বারা উত্পন্ন সুপারিশের গুণমান বিচার করা।
যদিও "গড় গড়" শব্দগুচ্ছ অপ্রয়োজনীয় শোনায়, মেট্রিকের নামটি উপযুক্ত। সর্বোপরি, এই মেট্রিকটি k মানগুলিতে একাধিক গড় নির্ভুলতার গড় খুঁজে পায়।
বিশেষজ্ঞদের মিশ্রণ
একটি প্রদত্ত ইনপুট টোকেন বা উদাহরণ প্রক্রিয়া করার জন্য শুধুমাত্র এর পরামিতিগুলির একটি উপসেট (একজন বিশেষজ্ঞ হিসাবে পরিচিত) ব্যবহার করে নিউরাল নেটওয়ার্ক দক্ষতা বাড়ানোর একটি স্কিম। একটি গেটিং নেটওয়ার্ক প্রতিটি ইনপুট টোকেন বা উদাহরণ সঠিক বিশেষজ্ঞের কাছে পাঠায়।
বিস্তারিত জানার জন্য, নিচের যে কোনো একটি পেপার দেখুন:
- আক্রোশজনকভাবে বৃহৎ নিউরাল নেটওয়ার্ক: বিক্ষিপ্তভাবে গেটেড মিশ্রণ-অফ-বিশেষজ্ঞ স্তর
- এক্সপার্ট চয়েস রাউটিং সহ বিশেষজ্ঞদের মিশ্রণ
এমএমআইটি
মাল্টিমোডাল নির্দেশের সংক্ষিপ্ত রূপ।
মডেল ক্যাসকেডিং
একটি সিস্টেম যা একটি নির্দিষ্ট অনুমান প্রশ্নের জন্য আদর্শ মডেল বেছে নেয়।
অনেক বড় (প্রচুর প্যারামিটার ) থেকে অনেক ছোট (অনেক কম পরামিতি) পর্যন্ত মডেলের একটি গ্রুপ কল্পনা করুন। খুব বড় মডেল ছোট মডেলের তুলনায় অনুমান সময়ে বেশি কম্পিউটেশনাল রিসোর্স ব্যবহার করে। যাইহোক, খুব বড় মডেলগুলি সাধারণত ছোট মডেলের তুলনায় আরও জটিল অনুরোধগুলি অনুমান করতে পারে। মডেল ক্যাসকেডিং অনুমান কোয়েরির জটিলতা নির্ধারণ করে এবং তারপর অনুমান সম্পাদনের জন্য উপযুক্ত মডেল বেছে নেয়। মডেল ক্যাসকেডিংয়ের প্রধান অনুপ্রেরণা হল সাধারণভাবে ছোট মডেল নির্বাচন করে অনুমান খরচ কমানো, এবং আরও জটিল প্রশ্নের জন্য শুধুমাত্র একটি বড় মডেল নির্বাচন করা।
কল্পনা করুন যে একটি ছোট মডেল একটি ফোনে চলে এবং সেই মডেলের একটি বড় সংস্করণ একটি দূরবর্তী সার্ভারে চলে। ভাল মডেল ক্যাসকেডিং ছোট মডেলটিকে সহজ অনুরোধগুলি পরিচালনা করতে সক্ষম করে এবং জটিল অনুরোধগুলি পরিচালনা করার জন্য শুধুমাত্র দূরবর্তী মডেলটিকে কল করে খরচ এবং বিলম্বতা হ্রাস করে৷
এছাড়াও মডেল রাউটার দেখুন।
মডেল রাউটার
অ্যালগরিদম যা মডেল ক্যাসকেডিং- এ অনুমানের জন্য আদর্শ মডেল নির্ধারণ করে। একটি মডেল রাউটার নিজেই সাধারণত একটি মেশিন লার্নিং মডেল যা ধীরে ধীরে শেখে কিভাবে একটি প্রদত্ত ইনপুটের জন্য সেরা মডেল বাছাই করা যায়। যাইহোক, একটি মডেল রাউটার কখনও কখনও একটি সহজ, নন-মেশিন লার্নিং অ্যালগরিদম হতে পারে।
MOE
বিশেষজ্ঞদের মিশ্রণের সংক্ষিপ্ত রূপ।
এমটি
মেশিন অনুবাদের সংক্ষিপ্ত রূপ।
এন
সঠিক উত্তর নেই (NORA)
একাধিক উপযুক্ত প্রতিক্রিয়া থাকার একটি প্রম্পট । উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পটের কোনো সঠিক উত্তর নেই:
হাতি নিয়ে একটা কৌতুক বলুন।
কোনো-এক-ডান-উত্তর প্রম্পট মূল্যায়ন করা চ্যালেঞ্জিং হতে পারে।
নোরা
কোন একটি সঠিক উত্তর জন্য সংক্ষেপণ.
ও
এক শট প্রম্পটিং
একটি প্রম্পট যাতে একটি উদাহরণ রয়েছে যা প্রদর্শন করে যে কীভাবে বড় ভাষা মডেলের প্রতিক্রিয়া জানানো উচিত। উদাহরণ স্বরূপ, নিচের প্রম্পটে একটি উদাহরণ রয়েছে যেটি একটি বৃহৎ ভাষার মডেল দেখায় কিভাবে এটি একটি প্রশ্নের উত্তর দিতে হবে।
এক প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কি? | যে প্রশ্নটির উত্তর আপনি LLM করতে চান। |
ফ্রান্স: EUR | একটি উদাহরণ. |
ভারত: | প্রকৃত প্রশ্ন. |
নিম্নলিখিত পদগুলির সাথে এক-শট প্রম্পটিং তুলনা করুন এবং বৈসাদৃশ্য করুন:
পৃ
প্যারামিটার-দক্ষ টিউনিং
একটি বৃহৎ প্রাক-প্রশিক্ষিত ভাষা মডেল (PLM) সম্পূর্ণ ফাইন-টিউনিংয়ের চেয়ে আরও দক্ষতার সাথে সূক্ষ্ম-টিউন করার কৌশলগুলির একটি সেট। প্যারামিটার-দক্ষ টিউনিং সাধারণত পূর্ণ সূক্ষ্ম-টিউনিংয়ের চেয়ে অনেক কম পরামিতিকে সূক্ষ্ম-টিউন করে, তবুও সাধারণত একটি বৃহৎ ভাষার মডেল তৈরি করে যা সম্পূর্ণ সূক্ষ্ম-টিউনিং থেকে নির্মিত একটি বৃহৎ ভাষার মডেল হিসাবে (বা প্রায় পাশাপাশি) কাজ করে।
এর সাথে পরামিতি-দক্ষ টিউনিং তুলনা করুন এবং বৈসাদৃশ্য করুন:
প্যারামিটার-দক্ষ টিউনিং প্যারামিটার-দক্ষ ফাইন-টিউনিং নামেও পরিচিত।
পিএলএম
প্রাক-প্রশিক্ষিত ভাষা মডেলের সংক্ষিপ্ত রূপ।
পোস্ট-প্রশিক্ষিত মডেল
ঢিলেঢালাভাবে সংজ্ঞায়িত শব্দ যা সাধারণত একটি প্রাক-প্রশিক্ষিত মডেলকে বোঝায় যা কিছু পোস্ট-প্রসেসিংয়ের মধ্য দিয়ে গেছে, যেমন নিচের এক বা একাধিক:
প্রাক-প্রশিক্ষিত মডেল
সাধারণত, একটি মডেল যা ইতিমধ্যে প্রশিক্ষিত হয়েছে। শব্দটি একটি পূর্বে প্রশিক্ষিত এমবেডিং ভেক্টরকেও বোঝাতে পারে।
প্রাক-প্রশিক্ষিত ভাষা মডেল শব্দটি সাধারণত একটি ইতিমধ্যে প্রশিক্ষিত বড় ভাষা মডেলকে বোঝায়।
প্রাক-প্রশিক্ষণ
একটি বড় ডেটাসেটে একটি মডেলের প্রাথমিক প্রশিক্ষণ৷ কিছু প্রাক-প্রশিক্ষিত মডেল হল আনাড়ি জায়ান্ট এবং সাধারণত অতিরিক্ত প্রশিক্ষণের মাধ্যমে পরিমার্জিত হতে হবে। উদাহরণস্বরূপ, এমএল বিশেষজ্ঞরা একটি বিশাল টেক্সট ডেটাসেটে, যেমন উইকিপিডিয়ার সমস্ত ইংরেজি পৃষ্ঠাগুলিতে একটি বড় ভাষার মডেলকে প্রাক-প্রশিক্ষণ দিতে পারে। প্রাক-প্রশিক্ষণের পরে, ফলস্বরূপ মডেলটি নিম্নলিখিত কৌশলগুলির মাধ্যমে আরও পরিমার্জিত হতে পারে:
প্রম্পট
একটি বৃহৎ ভাষার মডেলে ইনপুট হিসাবে প্রবেশ করা যেকোন পাঠ্য মডেলটিকে একটি নির্দিষ্ট উপায়ে আচরণ করার শর্ত দেয়। প্রম্পটগুলি একটি বাক্যাংশের মতো ছোট বা ইচ্ছাকৃতভাবে দীর্ঘ হতে পারে (উদাহরণস্বরূপ, একটি উপন্যাসের সম্পূর্ণ পাঠ্য)। প্রম্পটগুলি নিম্নলিখিত সারণীতে দেখানো সহ একাধিক বিভাগে পড়ে:
প্রম্পট বিভাগ | উদাহরণ | নোট |
---|---|---|
প্রশ্ন | একটি কবুতর কত দ্রুত উড়তে পারে? | |
নির্দেশ | স্বেচ্ছাচারিতা সম্পর্কে একটি মজার কবিতা লিখুন। | একটি প্রম্পট যা বড় ভাষা মডেলকে কিছু করতে বলে। |
উদাহরণ | HTML-এ মার্কডাউন কোড অনুবাদ করুন। যেমন: মার্কডাউন: * তালিকা আইটেম HTML: <ul> <li>তালিকা আইটেম</li> </ul> | এই উদাহরণের প্রম্পটে প্রথম বাক্যটি একটি নির্দেশ। প্রম্পটের অবশিষ্টাংশটি উদাহরণ। |
ভূমিকা | পদার্থবিদ্যায় পিএইচডি করার জন্য মেশিন লার্নিং প্রশিক্ষণে গ্রেডিয়েন্ট ডিসেন্ট কেন ব্যবহার করা হয় তা ব্যাখ্যা করুন। | বাক্যের প্রথম অংশটি একটি নির্দেশ; "পদার্থবিজ্ঞানে পিএইচডি করতে" বাক্যাংশটি ভূমিকা অংশ। |
মডেল সম্পূর্ণ করার জন্য আংশিক ইনপুট | যুক্তরাজ্যের প্রধানমন্ত্রী এখানে থাকেন | একটি আংশিক ইনপুট প্রম্পট হয় আকস্মিকভাবে শেষ হতে পারে (যেমন এই উদাহরণটি করে) অথবা একটি আন্ডারস্কোর দিয়ে শেষ হতে পারে। |
একটি জেনারেটিভ এআই মডেল টেক্সট, কোড, ইমেজ, এমবেডিং , ভিডিও...প্রায় যেকোন কিছুর সাথে প্রম্পটে সাড়া দিতে পারে।
প্রম্পট-ভিত্তিক শিক্ষা
নির্দিষ্ট মডেলের একটি ক্ষমতা যা তাদের স্বেচ্ছাচারী পাঠ্য ইনপুট ( প্রম্পট ) এর প্রতিক্রিয়ায় তাদের আচরণকে মানিয়ে নিতে সক্ষম করে। একটি সাধারণ প্রম্পট-ভিত্তিক শেখার দৃষ্টান্তে, একটি বৃহৎ ভাষা মডেল পাঠ্য তৈরি করে একটি প্রম্পটে সাড়া দেয়। উদাহরণস্বরূপ, ধরুন একজন ব্যবহারকারী নিম্নলিখিত প্রম্পটে প্রবেশ করে:
নিউটনের গতির তৃতীয় সূত্র সংক্ষিপ্ত কর।
প্রম্পট-ভিত্তিক শিক্ষার জন্য সক্ষম একটি মডেল পূর্ববর্তী প্রম্পটের উত্তর দেওয়ার জন্য বিশেষভাবে প্রশিক্ষিত নয়। বরং, মডেলটি পদার্থবিজ্ঞান সম্পর্কে অনেক তথ্য, সাধারণ ভাষার নিয়ম সম্পর্কে অনেক কিছু এবং সাধারণত দরকারী উত্তরগুলি কী গঠন করে সে সম্পর্কে অনেক কিছু "জানে"৷ সেই জ্ঞান একটি (আশা করি) দরকারী উত্তর প্রদানের জন্য যথেষ্ট। অতিরিক্ত মানুষের প্রতিক্রিয়া ("সেই উত্তরটি খুব জটিল ছিল।" বা "একটি প্রতিক্রিয়া কী?") কিছু প্রম্পট-ভিত্তিক শিক্ষা ব্যবস্থাকে তাদের উত্তরগুলির উপযোগিতাকে ধীরে ধীরে উন্নত করতে সক্ষম করে।
প্রম্পট নকশা
প্রম্পট ইঞ্জিনিয়ারিং এর প্রতিশব্দ।
প্রম্পট ইঞ্জিনিয়ারিং
প্রম্পট তৈরি করার শিল্প যা একটি বৃহৎ ভাষার মডেল থেকে পছন্দসই প্রতিক্রিয়াগুলি প্রকাশ করে। মানুষ প্রম্পট ইঞ্জিনিয়ারিং সঞ্চালন. সুগঠিত প্রম্পট লেখা একটি বড় ভাষা মডেল থেকে কার্যকর প্রতিক্রিয়া নিশ্চিত করার একটি অপরিহার্য অংশ। প্রম্পট ইঞ্জিনিয়ারিং অনেক কারণের উপর নির্ভর করে, যার মধ্যে রয়েছে:
- ডেটাসেটটি প্রাক-প্রশিক্ষণ এবং সম্ভবত বৃহৎ ভাষার মডেলটিকে সূক্ষ্ম-টিউন করতে ব্যবহৃত হয়।
- তাপমাত্রা এবং অন্যান্য ডিকোডিং পরামিতি যা মডেল প্রতিক্রিয়া তৈরি করতে ব্যবহার করে।
প্রম্পট ডিজাইন প্রম্পট ইঞ্জিনিয়ারিং এর প্রতিশব্দ।
সহায়ক প্রম্পট লেখার বিষয়ে আরও বিস্তারিত জানার জন্য প্রম্পট ডিজাইনের ভূমিকা দেখুন।
প্রম্পট টিউনিং
একটি পরামিতি দক্ষ টিউনিং প্রক্রিয়া যা একটি "প্রিফিক্স" শিখে যা সিস্টেমটি প্রকৃত প্রম্পটে প্রিপেন্ড করে।
প্রম্পট টিউনিং-এর একটি বৈচিত্র—কখনও কখনও প্রিফিক্স টিউনিং বলা হয়— প্রতিটি স্তরে উপসর্গটি প্রিপেন্ড করা। বিপরীতে, বেশিরভাগ প্রম্পট টিউনিং শুধুমাত্র ইনপুট স্তরে একটি উপসর্গ যোগ করে।
আর
রেফারেন্স টেক্সট
প্রম্পটে একজন বিশেষজ্ঞের প্রতিক্রিয়া। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পট দেওয়া হয়েছে:
প্রশ্ন অনুবাদ করুন "আপনার নাম কি?" ইংরেজি থেকে ফরাসি।
একজন বিশেষজ্ঞের প্রতিক্রিয়া হতে পারে:
মন্তব্য vous applez-vous?
বিভিন্ন মেট্রিক্স (যেমন ROUGE ) যে মাত্রায় রেফারেন্স টেক্সট একটি ML মডেলের তৈরি করা পাঠ্যের সাথে মেলে তা পরিমাপ করে।
হিউম্যান ফিডব্যাক থেকে রিইনফোর্সমেন্ট লার্নিং (RLHF)
একটি মডেলের প্রতিক্রিয়ার গুণমান উন্নত করতে মানব রেটারদের প্রতিক্রিয়া ব্যবহার করা। উদাহরণস্বরূপ, একটি RLHF মেকানিজম ব্যবহারকারীদেরকে একটি মডেলের প্রতিক্রিয়ার গুণমানকে 👍 বা 👎 ইমোজি দিয়ে রেট দিতে বলতে পারে। সিস্টেম তারপর সেই প্রতিক্রিয়ার উপর ভিত্তি করে তার ভবিষ্যত প্রতিক্রিয়া সামঞ্জস্য করতে পারে।
ভূমিকা প্রম্পটিং
একটি প্রম্পটের একটি ঐচ্ছিক অংশ যা একটি জেনারেটিভ এআই মডেলের প্রতিক্রিয়ার জন্য লক্ষ্য দর্শকদের সনাক্ত করে। রোল প্রম্পট ছাড়াই , একটি বৃহৎ ভাষা মডেল একটি উত্তর প্রদান করে যা প্রশ্ন জিজ্ঞাসাকারী ব্যক্তির পক্ষে কার্যকর হতে পারে বা নাও হতে পারে। একটি ভূমিকা প্রম্পট সহ , একটি বড় ভাষা মডেল এমনভাবে উত্তর দিতে পারে যা একটি নির্দিষ্ট লক্ষ্য দর্শকদের জন্য আরও উপযুক্ত এবং আরও সহায়ক। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পটগুলির ভূমিকা প্রম্পট অংশটি বোল্ডফেসে রয়েছে:
- অর্থনীতিতে পিএইচডি করার জন্য এই নথিটির সংক্ষিপ্ত বিবরণ দিন।
- একটি দশ বছর বয়সী জন্য জোয়ার কিভাবে কাজ করে বর্ণনা করুন.
- 2008 সালের আর্থিক সংকট ব্যাখ্যা কর। আপনি একটি ছোট শিশু বা একটি সোনার উদ্ধারকারীর সাথে কথা বলুন।
এস
নরম প্রম্পট টিউনিং
রিসোর্স ইনটেনসিভ ফাইন-টিউনিং ছাড়াই একটি নির্দিষ্ট কাজের জন্য একটি বড় ভাষার মডেল টিউন করার একটি কৌশল। মডেলের সমস্ত ওজন পুনরায় প্রশিক্ষণের পরিবর্তে, নরম প্রম্পট টিউনিং স্বয়ংক্রিয়ভাবে একই লক্ষ্য অর্জনের জন্য একটি প্রম্পট সামঞ্জস্য করে।
একটি পাঠ্য প্রম্পট দেওয়া হলে, সফ্ট প্রম্পট টিউনিং সাধারণত প্রম্পটে অতিরিক্ত টোকেন এম্বেডিং যুক্ত করে এবং ইনপুট অপ্টিমাইজ করতে ব্যাকপ্রোপগেশন ব্যবহার করে।
একটি "হার্ড" প্রম্পটে টোকেন এম্বেডিংয়ের পরিবর্তে প্রকৃত টোকেন থাকে।
টি
তাপমাত্রা
একটি হাইপারপ্যারামিটার যা একটি মডেলের আউটপুটের এলোমেলোতার মাত্রা নিয়ন্ত্রণ করে। উচ্চ তাপমাত্রার ফলে আরও এলোমেলো আউটপুট হয়, যখন কম তাপমাত্রার ফলে কম এলোমেলো আউটপুট হয়।
সেরা তাপমাত্রা নির্বাচন নির্দিষ্ট অ্যাপ্লিকেশন এবং মডেলের আউটপুট পছন্দের বৈশিষ্ট্য উপর নির্ভর করে। উদাহরণস্বরূপ, সৃজনশীল আউটপুট তৈরি করে এমন একটি অ্যাপ্লিকেশন তৈরি করার সময় আপনি সম্ভবত তাপমাত্রা বাড়াবেন। বিপরীতভাবে, মডেলের নির্ভুলতা এবং ধারাবাহিকতা উন্নত করার জন্য চিত্র বা পাঠ্যকে শ্রেণীবদ্ধ করে এমন একটি মডেল তৈরি করার সময় আপনি সম্ভবত তাপমাত্রা কমিয়ে দেবেন।
তাপমাত্রা প্রায়ই softmax সঙ্গে ব্যবহার করা হয়.
জেড
জিরো-শট প্রম্পটিং
একটি প্রম্পট যা আপনি বড় ভাষার মডেলটি কীভাবে প্রতিক্রিয়া জানাতে চান তার একটি উদাহরণ প্রদান করে না । যেমন:
এক প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কি? | যে প্রশ্নটির উত্তর আপনি LLM করতে চান। |
ভারত: | প্রকৃত প্রশ্ন. |
বৃহৎ ভাষার মডেল নিম্নোক্ত যেকোনো একটির সাথে সাড়া দিতে পারে:
- রুপি
- INR
- ₹
- ভারতীয় রুপি
- রুপি
- ভারতীয় রুপি
সমস্ত উত্তর সঠিক, যদিও আপনি একটি নির্দিষ্ট বিন্যাস পছন্দ করতে পারেন।
নিম্নোক্ত পদগুলির সাথে শূন্য-শট প্রম্পটিং তুলনা করুন এবং বৈসাদৃশ্য করুন:
,এই পৃষ্ঠায় জেনারেটিভ এআই শব্দকোষ রয়েছে। সকল শব্দকোষের জন্য এখানে ক্লিক করুন ।
ক
স্বয়ংক্রিয় মূল্যায়ন
একটি মডেলের আউটপুট গুণমান বিচার করতে সফ্টওয়্যার ব্যবহার করে.
যখন মডেল আউটপুট তুলনামূলকভাবে সহজবোধ্য হয়, তখন একটি স্ক্রিপ্ট বা প্রোগ্রাম মডেলের আউটপুটকে সোনালী প্রতিক্রিয়ার সাথে তুলনা করতে পারে। এই ধরনের স্বয়ংক্রিয় মূল্যায়নকে কখনও কখনও প্রোগ্রামেটিক মূল্যায়ন বলা হয়। মেট্রিক্স যেমন ROUGE বা BLEU প্রায়ই প্রোগ্রামেটিক মূল্যায়নের জন্য উপযোগী।
যখন মডেল আউটপুট জটিল হয় বা এর কোনো সঠিক উত্তর থাকে না , তখন একটি স্বয়ংক্রিয় এমএল প্রোগ্রাম নামে পরিচিত একটি স্বয়ংক্রিয় মূল্যায়ন করে।
মানুষের মূল্যায়নের সাথে বৈসাদৃশ্য।
অটোরাটার মূল্যায়ন
একটি জেনারেটিভ এআই মডেলের আউটপুটের গুণমান বিচার করার জন্য একটি হাইব্রিড প্রক্রিয়া যা মানুষের মূল্যায়নকে স্বয়ংক্রিয় মূল্যায়নের সাথে একত্রিত করে। একটি অটোরেটর হল একটি এমএল মডেল যা মানুষের মূল্যায়ন দ্বারা তৈরি ডেটার উপর প্রশিক্ষিত। আদর্শভাবে, একজন অটোরাটার একজন মানুষের মূল্যায়নকারীকে অনুকরণ করতে শেখে।প্রি-বিল্ট অটোরেটর উপলব্ধ, তবে সেরা অটোরেটরগুলি বিশেষভাবে আপনি যে কাজটি মূল্যায়ন করছেন তার জন্য সূক্ষ্ম সুর করা হয়।
অটো রিগ্রেসিভ মডেল
একটি মডেল যা তার নিজের পূর্বের ভবিষ্যদ্বাণীগুলির উপর ভিত্তি করে একটি ভবিষ্যদ্বাণী অনুমান করে৷ উদাহরণস্বরূপ, অটো-রিগ্রেসিভ ল্যাঙ্গুয়েজ মডেলগুলি পূর্বে ভবিষ্যদ্বাণী করা টোকেনের উপর ভিত্তি করে পরবর্তী টোকেনের পূর্বাভাস দেয়। সমস্ত ট্রান্সফরমার -ভিত্তিক বৃহৎ ভাষার মডেলগুলি স্বয়ংক্রিয়-রিগ্রেসিভ।
বিপরীতে, GAN- ভিত্তিক ইমেজ মডেলগুলি সাধারণত অটো-রিগ্রেসিভ হয় না কারণ তারা একটি একক ফরোয়ার্ড-পাসে একটি ছবি তৈরি করে এবং ধাপে ধাপে নয়। যাইহোক, কিছু ইমেজ জেনারেশন মডেল অটো-রিগ্রেসিভ কারণ তারা ধাপে ধাপে একটি ইমেজ তৈরি করে।
গ
চেইন-অফ-থট প্রম্পটিং
একটি প্রম্পট ইঞ্জিনিয়ারিং কৌশল যা একটি বৃহৎ ভাষা মডেল (LLM) কে ধাপে ধাপে তার যুক্তি ব্যাখ্যা করতে উৎসাহিত করে। উদাহরণস্বরূপ, দ্বিতীয় বাক্যে বিশেষ মনোযোগ দিয়ে নিম্নলিখিত প্রম্পটটি বিবেচনা করুন:
7 সেকেন্ডে প্রতি ঘন্টা 0 থেকে 60 মাইল পর্যন্ত যায় এমন একটি গাড়ীতে ড্রাইভার কতগুলি জি বাহিনী অভিজ্ঞতা অর্জন করবে? উত্তরে, সমস্ত প্রাসঙ্গিক গণনা দেখান।
এলএলএম এর প্রতিক্রিয়া সম্ভবত:
- উপযুক্ত স্থানে 0, 60 এবং 7 মানগুলিতে প্লাগিং করে পদার্থবিজ্ঞানের সূত্রগুলির একটি ক্রম দেখান।
- কেন এটি সেই সূত্রগুলি বেছে নিয়েছে এবং বিভিন্ন ভেরিয়েবলের অর্থ কী তা ব্যাখ্যা করুন।
চেইন-অফ-চিন্তা-ভাবনা এলএলএমকে সমস্ত গণনা সম্পাদন করতে বাধ্য করে, যা আরও সঠিক উত্তরের দিকে নিয়ে যেতে পারে। তদ্ব্যতীত, চেইন-অফ-চিন্তাভাবনা প্রম্পট ব্যবহারকারীকে উত্তরটি বোঝা যায় কি না তা নির্ধারণের জন্য এলএলএমের পদক্ষেপগুলি পরীক্ষা করতে সক্ষম করে।
চ্যাট
একটি এমএল সিস্টেমের সাথে ব্যাক-অ্যান্ড-ফরথ কথোপকথনের বিষয়বস্তু, সাধারণত একটি বৃহত ভাষার মডেল । একটি চ্যাটে পূর্ববর্তী মিথস্ক্রিয়া (আপনি কী টাইপ করেছেন এবং বড় ভাষার মডেল কীভাবে প্রতিক্রিয়া জানিয়েছেন) চ্যাটের পরবর্তী অংশগুলির প্রসঙ্গে পরিণত হয়।
একটি চ্যাটবট একটি বৃহত ভাষার মডেলের অ্যাপ্লিকেশন।
প্রাসঙ্গিক ভাষা এম্বেডিং
একটি এম্বেডিং যা সাবলীল মানব বক্তারা যেভাবে পারে সেভাবে শব্দ এবং বাক্যাংশগুলি "বোঝার" কাছাকাছি আসে। প্রাসঙ্গিক ভাষা এম্বেডিংগুলি জটিল সিনট্যাক্স, শব্দার্থবিজ্ঞান এবং প্রসঙ্গ বুঝতে পারে।
উদাহরণস্বরূপ, ইংরেজি শব্দ গরুর এম্বেডিংগুলি বিবেচনা করুন। ওয়ার্ড 2 ভিসি এর মতো পুরানো এম্বেডিংগুলি ইংরেজী শব্দের প্রতিনিধিত্ব করতে পারে যেমন গরু থেকে ষাঁড়ের এম্বেডিং স্পেসের দূরত্বটি ইও (মহিলা ভেড়া) থেকে র্যাম (পুরুষ ভেড়া) বা মহিলা থেকে পুরুষের দূরত্বের সমান। প্রাসঙ্গিক ভাষার এম্বেডিংগুলি স্বীকৃতি দিয়ে আরও এক ধাপ এগিয়ে যেতে পারে যে ইংরেজী স্পিকাররা কখনও কখনও গাভী বা ষাঁড়কে বোঝাতে গরু শব্দটি ব্যবহার করে ব্যবহার করে।
প্রসঙ্গ উইন্ডো
একটি মডেল টোকেন সংখ্যা প্রদত্ত প্রম্পটে প্রক্রিয়া করতে পারে। প্রসঙ্গ উইন্ডোটি যত বড় হবে, প্রম্পটে সুসংগত এবং ধারাবাহিক প্রতিক্রিয়া সরবরাহ করতে মডেল যত বেশি তথ্য ব্যবহার করতে পারে।
ডি
সরাসরি অনুরোধ
শূন্য-শট অনুরোধের প্রতিশব্দ।
পাতন
একটি মডেলের আকার ( শিক্ষক হিসাবে পরিচিত) একটি ছোট মডেল ( ছাত্র হিসাবে পরিচিত) হিসাবে হ্রাস করার প্রক্রিয়া যা মূল মডেলের ভবিষ্যদ্বাণীগুলিকে যথাসম্ভব বিশ্বস্ততার সাথে অনুকরণ করে। পাতন দরকারী কারণ বৃহত্তর মডেলের (শিক্ষক) এর চেয়ে ছোট মডেলের দুটি মূল সুবিধা রয়েছে:
- দ্রুত অনুমান সময়
- হ্রাস মেমরি এবং শক্তি ব্যবহার
তবে, শিক্ষার্থীর ভবিষ্যদ্বাণীগুলি সাধারণত শিক্ষকের ভবিষ্যদ্বাণীগুলির মতো ভাল নয়।
ডিস্টিলেশন শিক্ষার্থী এবং শিক্ষক মডেলগুলির পূর্বাভাসের ফলাফলের মধ্যে পার্থক্যের উপর ভিত্তি করে লোকসানের কার্যকারিতা হ্রাস করতে শিক্ষার্থীদের মডেলকে প্রশিক্ষণ দেয়।
নিম্নলিখিত পদগুলির সাথে তুলনা করুন এবং বিপরীতে তুলনা করুন:
ই
evas
প্রাথমিকভাবে এলএলএম মূল্যায়নের জন্য সংক্ষিপ্তসার হিসাবে ব্যবহৃত হয়। আরও বিস্তৃতভাবে, এভালস যে কোনও ধরণের মূল্যায়নের সংক্ষিপ্তসার।
মূল্যায়ন
কোনও মডেলের গুণমান পরিমাপ বা একে অপরের বিরুদ্ধে বিভিন্ন মডেল তুলনা করার প্রক্রিয়া।
তদারকি করা মেশিন লার্নিং মডেলটি মূল্যায়ন করতে, আপনি সাধারণত এটি একটি বৈধতা সেট এবং একটি পরীক্ষার সেটের বিরুদ্ধে বিচার করেন। একটি এলএলএম মূল্যায়ন সাধারণত বিস্তৃত মানের এবং সুরক্ষা মূল্যায়ন জড়িত।
চ
বাস্তবতা
এমএল ওয়ার্ল্ডের মধ্যে, এমন একটি সম্পত্তি যা এমন একটি মডেল বর্ণনা করে যার আউটপুট বাস্তবতার উপর ভিত্তি করে। সত্যতা একটি মেট্রিকের চেয়ে একটি ধারণা। উদাহরণস্বরূপ, ধরুন আপনি একটি বৃহত ভাষার মডেলটিতে নিম্নলিখিত প্রম্পটটি প্রেরণ করেছেন:
টেবিল লবণের রাসায়নিক সূত্র কি?
সত্যবাদীতার অনুকূলকরণের একটি মডেল প্রতিক্রিয়া জানাবে:
NaCl
এটি ধরে নেওয়া লোভনীয় যে সমস্ত মডেল সত্যতার উপর ভিত্তি করে হওয়া উচিত। যাইহোক, কিছু প্রম্পট, যেমন নিম্নলিখিতগুলি, একটি জেনারেটর এআই মডেলকে সত্যতার চেয়ে সৃজনশীলতাকে অনুকূল করতে হবে।
আমাকে একজন নভোচারী এবং একটি শুঁয়োপোকা সম্পর্কে একটি লিমেরিক বলুন।
ফলস্বরূপ লিমেরিক বাস্তবতার উপর ভিত্তি করে তৈরি হওয়ার সম্ভাবনা কম।
ভিত্তিহীনতার সাথে বৈপরীত্য।
কয়েকটি শট অনুরোধ
একটি প্রম্পট যাতে একাধিক (একটি "কয়েকটি") উদাহরণ রয়েছে যা বৃহত্তর ভাষার মডেলটির প্রতিক্রিয়া জানানো উচিত তা প্রদর্শন করে। উদাহরণস্বরূপ, নিম্নলিখিত দীর্ঘ প্রম্পটে দুটি উদাহরণ রয়েছে যা একটি বৃহত ভাষার মডেল দেখায় কীভাবে একটি প্রশ্নের উত্তর দিতে হয়।
একটি প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কী? | আপনি যে প্রশ্নের উত্তর চান তা প্রশ্নের উত্তর দিন। |
ফ্রান্স: ইউরো | একটি উদাহরণ. |
যুক্তরাজ্য: জিবিপি | আরেকটি উদাহরণ। |
ভারত: | আসল ক্যোয়ারী। |
কয়েকটি শট প্রম্পটিং সাধারণত শূন্য-শট প্রম্পটিং এবং এক-শট প্রম্পটিংয়ের চেয়ে বেশি পছন্দসই ফলাফল তৈরি করে। তবে কয়েকটি শট প্রম্পটিংয়ের জন্য আরও দীর্ঘতর প্রম্পট প্রয়োজন।
কয়েকটি শট প্রম্পটিং হ'ল প্রম্পট-ভিত্তিক শিক্ষার জন্য প্রয়োগ করা কয়েকটি শট শেখার একটি ফর্ম।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে প্রম্পট ইঞ্জিনিয়ারিং দেখুন।
সূক্ষ্ম টিউনিং
একটি দ্বিতীয়, টাস্ক-নির্দিষ্ট প্রশিক্ষণ পাস একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে এর পরামিতিগুলি পরিমার্জন করতে প্রাক-প্রশিক্ষিত মডেলটিতে সম্পাদিত। উদাহরণস্বরূপ, কিছু বড় ভাষার মডেলগুলির জন্য সম্পূর্ণ প্রশিক্ষণের ক্রমটি নিম্নরূপ:
- প্রাক-প্রশিক্ষণ: একটি বিশাল সাধারণ ডেটাসেটে একটি বৃহত ভাষার মডেল প্রশিক্ষণ দিন, যেমন সমস্ত ইংরেজি ভাষার উইকিপিডিয়া পৃষ্ঠাগুলি।
- সূক্ষ্ম-টিউনিং: প্রাক-প্রশিক্ষিত মডেলটিকে একটি নির্দিষ্ট কাজ সম্পাদনের জন্য প্রশিক্ষণ দিন, যেমন মেডিকেল প্রশ্নের প্রতিক্রিয়া জানানো। ফাইন-টিউনিংয়ে সাধারণত নির্দিষ্ট কার্যের উপর দৃষ্টি নিবদ্ধ করে কয়েকশো বা হাজার হাজার উদাহরণ জড়িত।
অন্য উদাহরণ হিসাবে, একটি বৃহত চিত্র মডেলের সম্পূর্ণ প্রশিক্ষণ ক্রমটি নিম্নরূপ:
- প্রাক-প্রশিক্ষণ: উইকিমিডিয়া কমন্সের সমস্ত চিত্রের মতো একটি বিশাল সাধারণ চিত্র ডেটাসেটে একটি বৃহত চিত্রের মডেল প্রশিক্ষণ দিন।
- সূক্ষ্ম-টিউনিং: অর্কাসের চিত্র তৈরি করার মতো একটি নির্দিষ্ট কাজ সম্পাদনের জন্য প্রাক-প্রশিক্ষিত মডেলটিকে প্রশিক্ষণ দিন।
সূক্ষ্ম-টিউনিং নিম্নলিখিত কৌশলগুলির যে কোনও সংমিশ্রণকে জড়িত করতে পারে:
- প্রাক-প্রশিক্ষিত মডেলের বিদ্যমান সমস্ত পরামিতিগুলি সংশোধন করা। এটিকে কখনও কখনও পুরো সূক্ষ্ম-টিউনিং বলা হয়।
- অন্যান্য বিদ্যমান প্যারামিটারগুলি অপরিবর্তিত রাখার সময় (সাধারণত, আউটপুট স্তরটির নিকটতম স্তরগুলি) প্রাক-প্রশিক্ষিত মডেলের বিদ্যমান কিছু পরামিতিগুলি সংশোধন করা হয় (সাধারণত, ইনপুট স্তরের নিকটতম স্তরগুলি)। প্যারামিটার-দক্ষ টিউনিং দেখুন।
- আরও স্তর যুক্ত করা, সাধারণত আউটপুট স্তরটির নিকটতম বিদ্যমান স্তরগুলির শীর্ষে।
ফাইন-টিউনিং হ'ল ট্রান্সফার লার্নিংয়ের একটি ফর্ম। যেমন, সূক্ষ্ম-টিউনিং প্রাক-প্রশিক্ষিত মডেলটিকে প্রশিক্ষণের জন্য ব্যবহৃত তুলনায় আলাদা লোকসান ফাংশন বা আলাদা মডেল টাইপ ব্যবহার করতে পারে। উদাহরণস্বরূপ, আপনি একটি রিগ্রেশন মডেল তৈরি করতে একটি প্রাক-প্রশিক্ষিত বৃহত চিত্রের মডেলটি সূক্ষ্ম-সুর করতে পারেন যা একটি ইনপুট চিত্রটিতে পাখির সংখ্যা প্রদান করে।
নিম্নলিখিত শর্তগুলির সাথে তুলনা করুন এবং তুলনা করুন:
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে ফাইন-টিউনিং দেখুন।
সাফল্যের ভগ্নাংশ
এমএল মডেলের উত্পন্ন পাঠ্য মূল্যায়নের জন্য একটি মেট্রিক। সাফল্যের ভগ্নাংশ হ'ল উত্পন্ন পাঠ্য আউটপুটগুলির মোট সংখ্যা দ্বারা বিভক্ত "সফল" উত্পন্ন পাঠ্য আউটপুটগুলির সংখ্যা। উদাহরণস্বরূপ, যদি একটি বৃহত ভাষার মডেল 10 টি ব্লক কোড তৈরি করে, যার মধ্যে পাঁচটি সফল হয়েছিল, তবে সাফল্যের ভগ্নাংশটি 50%হবে।
যদিও সাফল্যের ভগ্নাংশটি পরিসংখ্যান জুড়ে ব্যাপকভাবে কার্যকর, এমএল এর মধ্যে, এই মেট্রিকটি মূলত কোড জেনারেশন বা গণিত সমস্যার মতো যাচাইযোগ্য কাজগুলি পরিমাপ করার জন্য কার্যকর।
জি
মিথুন
গুগলের সর্বাধিক উন্নত এআই সমন্বিত বাস্তুতন্ত্র। এই বাস্তুতন্ত্রের উপাদানগুলির মধ্যে রয়েছে:
- বিভিন্ন মিথুন মডেল ।
- মিথুনের মডেলটিতে ইন্টারেক্টিভ কথোপকথন ইন্টারফেস। ব্যবহারকারীদের টাইপ প্রম্পটগুলি এবং মিথুনগুলি সেই অনুরোধগুলিতে সাড়া দেয়।
- বিভিন্ন জেমিনি এপিআই।
- মিথুন মডেলগুলির উপর ভিত্তি করে বিভিন্ন ব্যবসায়িক পণ্য; উদাহরণস্বরূপ, গুগল ক্লাউডের জন্য মিথুন ।
মিথুন মডেল
গুগলের অত্যাধুনিক ট্রান্সফর্মার ভিত্তিক মাল্টিমোডাল মডেল । মিথুন মডেলগুলি বিশেষত এজেন্টদের সাথে সংহত করার জন্য ডিজাইন করা হয়েছে।
ব্যবহারকারীরা ইন্টারেক্টিভ ডায়ালগ ইন্টারফেসের মাধ্যমে এবং এসডিকেগুলির মাধ্যমে বিভিন্ন উপায়ে মিথুনের মডেলগুলির সাথে ইন্টারঅ্যাক্ট করতে পারেন।
উত্পন্ন পাঠ্য
সাধারণভাবে, একটি এমএল মডেল আউটপুট দেয় এমন পাঠ্য। বড় ভাষার মডেলগুলি মূল্যায়ন করার সময়, কিছু মেট্রিকগুলি রেফারেন্স পাঠ্যের সাথে উত্পন্ন পাঠ্যের তুলনা করে। উদাহরণস্বরূপ, ধরুন আপনি কোনও এমএল মডেল ফরাসি থেকে ডাচগুলিতে কীভাবে কার্যকরভাবে অনুবাদ করে তা নির্ধারণ করার চেষ্টা করছেন। এই ক্ষেত্রে:
- উত্পন্ন পাঠ্যটি হ'ল ডাচ অনুবাদ যা এমএল মডেল আউটপুট দেয়।
- রেফারেন্স পাঠ্যটি হ'ল ডাচ অনুবাদ যা কোনও মানব অনুবাদক (বা সফ্টওয়্যার) তৈরি করে।
নোট করুন যে কিছু মূল্যায়ন কৌশলগুলি রেফারেন্স পাঠ্য জড়িত না।
জেনারেটিভ এআই
কোনও আনুষ্ঠানিক সংজ্ঞা ছাড়াই একটি উদীয়মান রূপান্তরকারী ক্ষেত্র। এটি বলেছিল, বেশিরভাগ বিশেষজ্ঞরা সম্মত হন যে জেনারেটর এআই মডেলগুলি নিম্নলিখিতগুলির মধ্যে থাকা সমস্ত সামগ্রী তৈরি করতে পারে ("উত্পন্ন"):
- জটিল
- সুসঙ্গত
- মূল
উদাহরণস্বরূপ, একটি জেনারেটর এআই মডেল পরিশীলিত প্রবন্ধ বা চিত্র তৈরি করতে পারে।
এলএসটিএমএস এবং আরএনএন সহ কিছু পূর্ববর্তী প্রযুক্তিগুলি মূল এবং সুসংগত সামগ্রীও তৈরি করতে পারে। কিছু বিশেষজ্ঞরা এই পূর্ববর্তী প্রযুক্তিগুলিকে জেনারেটর এআই হিসাবে দেখেন, আবার অন্যরা মনে করেন যে সত্যিকারের জেনারেটরি এআইয়ের আগের প্রযুক্তিগুলি উত্পাদন করতে পারে তার চেয়ে আরও জটিল আউটপুট প্রয়োজন।
ভবিষ্যদ্বাণীমূলক এমএল এর সাথে বিপরীতে।
সোনার প্রতিক্রিয়া
একটি উত্তর ভাল হিসাবে পরিচিত। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পট দেওয়া:
2 + 2
সোনার প্রতিক্রিয়া আশা করি:
4
এইচ
মানব মূল্যায়ন
এমন একটি প্রক্রিয়া যাতে লোকেরা এমএল মডেলের আউটপুটটির গুণমান বিচার করে; উদাহরণস্বরূপ, দ্বিভাষিক লোকেরা এমএল অনুবাদ মডেলের মানের বিচার করে। মানুষের মূল্যায়ন এমন মডেলগুলির বিচারের জন্য বিশেষভাবে কার্যকর যার সঠিক উত্তর নেই ।
স্বয়ংক্রিয় মূল্যায়ন এবং অটোরেটার মূল্যায়নের সাথে বৈপরীত্য।
লুপে মানব (হিটল)
একটি আলগাভাবে সংজ্ঞায়িত ইডিয়ম যার অর্থ নিম্নলিখিতগুলির মধ্যে হতে পারে:
- জেনারেটর এআই আউটপুট সমালোচনামূলকভাবে বা সংশয়ীভাবে দেখার নীতি। উদাহরণস্বরূপ, এই এমএল শব্দকোষটি লেখার মানুষেরা বড় ভাষার মডেলগুলি কী করতে পারে তা দেখে অবাক হয়ে যায় তবে বড় ভাষার মডেলগুলি যে ভুলগুলি করে তা মনে করে।
- লোকেরা কোনও মডেলের আচরণকে আকার, মূল্যায়ন করতে এবং পরিমার্জন করতে সহায়তা করে তা নিশ্চিত করার জন্য একটি কৌশল বা সিস্টেম। লুপে মানুষকে রাখা একটি এআইকে মেশিন বুদ্ধি এবং মানব বুদ্ধি উভয় থেকে উপকৃত করতে সক্ষম করে। উদাহরণস্বরূপ, এমন একটি সিস্টেম যেখানে কোনও এআই কোড তৈরি করে যা সফ্টওয়্যার ইঞ্জিনিয়াররা তারপরে পর্যালোচনা করে তা হ'ল একটি হিউম্যান-ইন-দ্য লুপ সিস্টেম।
আমি
প্রেক্ষাপটে শিক্ষা
কয়েকটি শট প্রম্পটিংয়ের প্রতিশব্দ।
নির্দেশ টিউনিং
সূক্ষ্ম সুরের একটি ফর্ম যা নির্দেশাবলী অনুসরণ করার জন্য একটি জেনারেটর এআই মডেলের ক্ষমতাকে উন্নত করে। নির্দেশিকা টিউনিংয়ের মধ্যে একটি সিরিজ নির্দেশের একটি মডেল প্রশিক্ষণ জড়িত, সাধারণত বিভিন্ন ধরণের কাজ কভার করে। ফলস্বরূপ নির্দেশ-সুরযুক্ত মডেলটি তখন বিভিন্ন কার্যগুলিতে শূন্য-শট প্রম্পটগুলিতে দরকারী প্রতিক্রিয়া তৈরি করতে ঝোঁক।
এর সাথে তুলনা এবং বৈসাদৃশ্য:
এল
এলএলএম
বড় ভাষার মডেলের জন্য সংক্ষিপ্তসার।
এলএলএম মূল্যায়ন (ইভালস)
বৃহত ভাষার মডেলগুলির (এলএলএম) পারফরম্যান্স মূল্যায়নের জন্য মেট্রিক এবং মানদণ্ডের একটি সেট। একটি উচ্চ স্তরে, এলএলএম মূল্যায়ন:
- গবেষকদের এমন অঞ্চলগুলি সনাক্ত করতে সহায়তা করুন যেখানে এলএলএমের উন্নতি প্রয়োজন।
- বিভিন্ন এলএলএমের তুলনা এবং একটি নির্দিষ্ট কাজের জন্য সেরা এলএলএম সনাক্ত করতে দরকারী।
- এলএলএমগুলি ব্যবহারের জন্য নিরাপদ এবং নৈতিক রয়েছে তা নিশ্চিত করতে সহায়তা করুন।
আরও তথ্যের জন্য মেশিন লার্নিং ক্র্যাশ কোর্সে বড় ভাষার মডেলগুলি (এলএলএম) দেখুন।
LoRA
স্বল্প-র্যাঙ্ক অভিযোজনযোগ্যতার জন্য সংক্ষেপণ।
নিম্ন-র্যাঙ্ক অভিযোজনযোগ্যতা (এলওআরএ)
সূক্ষ্ম সুরের জন্য একটি প্যারামিটার-দক্ষ কৌশল যা মডেলের প্রাক-প্রশিক্ষিত ওজনকে "হিমায়িত" করে (যেমন তারা আর সংশোধন করা যায় না) এবং তারপরে মডেলটিতে ট্রেনযোগ্য ওজনের একটি ছোট সেট সন্নিবেশ করে। ট্রেনেবল ওজনের এই সেটটি ("আপডেট ম্যাট্রিক্স" নামেও পরিচিত) বেস মডেলের চেয়ে যথেষ্ট ছোট এবং তাই প্রশিক্ষণের জন্য আরও দ্রুত।
লোরা নিম্নলিখিত সুবিধাগুলি সরবরাহ করে:
- ফাইন টিউনিং প্রয়োগ করা হয় এমন ডোমেনের জন্য কোনও মডেলের ভবিষ্যদ্বাণীগুলির গুণমানকে উন্নত করে।
- একটি মডেলের সমস্ত প্যারামিটারগুলির সূক্ষ্ম সুরের প্রয়োজন এমন কৌশলগুলির চেয়ে আরও দ্রুত সুরগুলি।
- একই বেস মডেলটি ভাগ করে নেওয়ার একাধিক বিশেষ মডেলগুলির একযোগে পরিবেশন সক্ষম করে অনুমানের গণ্য ব্যয় হ্রাস করে।
এম
মেশিন অনুবাদ
একটি মানব ভাষা থেকে অন্য মানব ভাষায় পাঠ্য রূপান্তর করতে সফ্টওয়্যার (সাধারণত একটি মেশিন লার্নিং মডেল) ব্যবহার করে উদাহরণস্বরূপ, ইংরেজি থেকে জাপানি ভাষায়।
কে কে (মানচিত্র@কে) এর গড় গড় নির্ভুলতা
বৈধতা ডেটাসেট জুড়ে কে স্কোরগুলিতে সমস্ত গড় যথার্থতার পরিসংখ্যানগত গড়। কে -তে গড় গড় যথার্থতার একটি ব্যবহার হ'ল একটি সুপারিশ সিস্টেম দ্বারা উত্পাদিত সুপারিশগুলির মানের বিচার করা।
যদিও "গড় গড়" শব্দটি অপ্রয়োজনীয় শোনায়, মেট্রিকের নাম উপযুক্ত। সর্বোপরি, এই মেট্রিক কে মানগুলিতে একাধিক গড় যথার্থতার গড় সন্ধান করে।
বিশেষজ্ঞদের মিশ্রণ
প্রদত্ত ইনপুট টোকেন বা উদাহরণ প্রক্রিয়া করার জন্য কেবল তার প্যারামিটারগুলির একটি উপসেট ( বিশেষজ্ঞ হিসাবে পরিচিত) ব্যবহার করে নিউরাল নেটওয়ার্ক দক্ষতা বাড়ানোর জন্য একটি স্কিম। একটি গেটিং নেটওয়ার্ক প্রতিটি ইনপুট টোকেন বা যথাযথ বিশেষজ্ঞের কাছে উদাহরণ দেয়।
বিশদের জন্য, নিম্নলিখিত যে কোনও একটি কাগজ দেখুন:
- অতিমাত্রায় বড় নিউরাল নেটওয়ার্কগুলি: স্পেসলি-গেটেড মিশ্রণ-বিশেষজ্ঞের স্তর
- বিশেষজ্ঞ পছন্দ রাউটিং সহ মিশ্রণ-বিশেষজ্ঞ
এমএমআইটি
মাল্টিমোডাল নির্দেশনা-সুরের জন্য সংক্ষিপ্তসার।
মডেল ক্যাসকেডিং
একটি সিস্টেম যা একটি নির্দিষ্ট অনুমানের প্রশ্নের জন্য আদর্শ মডেলটি বেছে নেয়।
খুব বড় (প্রচুর পরামিতি ) থেকে অনেক ছোট (অনেক কম পরামিতি) পর্যন্ত মডেলগুলির একটি গ্রুপ কল্পনা করুন। খুব বড় মডেলগুলি ছোট মডেলের চেয়ে অনুমানের সময়ে আরও গণনামূলক সংস্থান গ্রহণ করে। তবে, খুব বড় মডেলগুলি সাধারণত ছোট মডেলের চেয়ে বেশি জটিল অনুরোধগুলি অনুমান করতে পারে। মডেল ক্যাসকেডিং অনুমানের প্রশ্নের জটিলতা নির্ধারণ করে এবং তারপরে অনুমানটি সম্পাদন করার জন্য উপযুক্ত মডেলটি বেছে নেয়। মডেল ক্যাসকেডিংয়ের মূল অনুপ্রেরণা হ'ল সাধারণত ছোট মডেলগুলি নির্বাচন করে অনুমানের ব্যয় হ্রাস করা এবং কেবলমাত্র আরও জটিল প্রশ্নের জন্য একটি বৃহত্তর মডেল নির্বাচন করা।
কল্পনা করুন যে একটি ছোট মডেল একটি ফোনে চলে এবং সেই মডেলের একটি বৃহত সংস্করণ একটি দূরবর্তী সার্ভারে চলে। ভাল মডেল ক্যাসকেডিং সহজ অনুরোধগুলি পরিচালনা করতে ছোট মডেলটিকে সক্ষম করে এবং জটিল অনুরোধগুলি পরিচালনা করতে কেবল দূরবর্তী মডেলকে কল করে ব্যয় এবং বিলম্বকে হ্রাস করে।
মডেল রাউটারও দেখুন।
মডেল রাউটার
মডেল ক্যাসকেডিংয়ে অনুমানের জন্য আদর্শ মডেল নির্ধারণ করে এমন অ্যালগরিদম। একটি মডেল রাউটার নিজেই সাধারণত একটি মেশিন লার্নিং মডেল যা ধীরে ধীরে কীভাবে প্রদত্ত ইনপুটটির জন্য সেরা মডেলটি বেছে নিতে হয় তা শিখতে পারে। যাইহোক, একটি মডেল রাউটার কখনও কখনও একটি সহজ, নন-মেশিন লার্নিং অ্যালগরিদম হতে পারে।
MOE
বিশেষজ্ঞদের মিশ্রণের জন্য সংক্ষেপণ।
এমটি
মেশিন অনুবাদ জন্য সংক্ষিপ্তসার।
এন
কারও সঠিক উত্তর নেই (নোরা)
একটি প্রম্পট একাধিক উপযুক্ত প্রতিক্রিয়া আছে। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পটের কোনও সঠিক উত্তর নেই:
হাতি সম্পর্কে একটি রসিকতা বলুন।
কোনও-ডান-উত্তর প্রম্পটগুলি মূল্যায়ন করা চ্যালেঞ্জিং হতে পারে।
নোরা
কারওর জন্য সংক্ষিপ্তসার সঠিক উত্তর নেই ।
ও
এক শট অনুরোধ
একটি প্রম্পট যাতে বৃহত্তর ভাষার মডেলটির প্রতিক্রিয়া জানানো উচিত তা প্রদর্শন করে এমন একটি উদাহরণ রয়েছে। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পটে একটি বৃহত ভাষার মডেল দেখানো একটি উদাহরণ রয়েছে যা এটি কোনও প্রশ্নের উত্তর কীভাবে দেওয়া উচিত।
একটি প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কী? | আপনি যে প্রশ্নের উত্তর চান তা প্রশ্নের উত্তর দিন। |
ফ্রান্স: ইউরো | একটি উদাহরণ. |
ভারত: | আসল ক্যোয়ারী। |
নিম্নলিখিত শর্তগুলির সাথে এক-শট অনুরোধের তুলনা করুন এবং বিপরীতে:
পৃ
প্যারামিটার-দক্ষ টিউনিং
পুরো সূক্ষ্ম-টিউনিংয়ের চেয়ে আরও দক্ষতার সাথে একটি বৃহত প্রাক-প্রশিক্ষিত ভাষার মডেল (পিএলএম) সূক্ষ্ম সুর করার কৌশলগুলির একটি সেট। প্যারামিটার-দক্ষ টিউনিং সাধারণত সূক্ষ্ম-সুরের তুলনায় খুব কম প্যারামিটারগুলি সূক্ষ্ম-টিউন করে, তবুও সাধারণত একটি বৃহত ভাষার মডেল তৈরি করে যা পুরো ফাইন-টিউনিং থেকে নির্মিত একটি বৃহত ভাষার মডেল হিসাবে (বা প্রায় পাশাপাশি) সম্পাদন করে।
এর সাথে তুলনা করুন এবং বিপরীতে প্যারামিটার-দক্ষ টিউনিং:
প্যারামিটার-দক্ষ টিউনিং প্যারামিটার-দক্ষ সূক্ষ্ম-টিউনিং হিসাবেও পরিচিত।
পিএলএম
প্রাক-প্রশিক্ষিত ভাষার মডেলের সংক্ষেপণ।
প্রশিক্ষিত পোস্ট মডেল
আলগাভাবে সংজ্ঞায়িত শব্দ যা সাধারণত একটি প্রাক-প্রশিক্ষিত মডেলকে বোঝায় যা কিছু পোস্ট-প্রসেসিংয়ের মধ্য দিয়ে গেছে, যেমন নিম্নলিখিতগুলির এক বা একাধিক:
প্রাক প্রশিক্ষিত মডেল
সাধারণত, একটি মডেল যা ইতিমধ্যে প্রশিক্ষিত হয়েছে। এই শব্দটির অর্থ পূর্বে প্রশিক্ষিত এম্বেডিং ভেক্টরও হতে পারে।
প্রাক-প্রশিক্ষিত ভাষার মডেল শব্দটি সাধারণত ইতিমধ্যে প্রশিক্ষিত বৃহত ভাষার মডেলকে বোঝায়।
প্রাক-প্রশিক্ষণ
একটি বড় ডেটাসেটে একটি মডেলের প্রাথমিক প্রশিক্ষণ। কিছু প্রাক-প্রশিক্ষিত মডেল হ'ল আনাড়ি জায়ান্ট এবং সাধারণত অতিরিক্ত প্রশিক্ষণের মাধ্যমে অবশ্যই পরিমার্জন করা উচিত। উদাহরণস্বরূপ, এমএল বিশেষজ্ঞরা উইকিপিডিয়ায় সমস্ত ইংরেজি পৃষ্ঠাগুলির মতো একটি বিশাল পাঠ্য ডেটাসেটে একটি বৃহত ভাষার মডেল প্রাক-প্রশিক্ষণ দিতে পারেন। প্রাক-প্রশিক্ষণ অনুসরণ করে, ফলাফলের মডেলটি নিম্নলিখিত যে কোনও কৌশলগুলির মাধ্যমে আরও পরিমার্জন করা যেতে পারে:
প্রম্পট
যে কোনও পাঠ্য নির্দিষ্ট উপায়ে আচরণ করার জন্য মডেলটিকে শর্ত করতে একটি বৃহত ভাষার মডেলটিতে ইনপুট হিসাবে প্রবেশ করেছে। প্রম্পটগুলি একটি বাক্যাংশ বা নির্বিচারে দীর্ঘ হিসাবে সংক্ষিপ্ত হতে পারে (উদাহরণস্বরূপ, একটি উপন্যাসের পুরো পাঠ্য)। প্রম্পটগুলি নিম্নলিখিত সারণীতে প্রদর্শিতগুলি সহ একাধিক বিভাগে পড়ে:
প্রম্পট বিভাগ | উদাহরণ | নোট |
---|---|---|
প্রশ্ন | একটি কবুতর কত দ্রুত উড়তে পারে? | |
নির্দেশ | সালিশ সম্পর্কে একটি মজার কবিতা লিখুন। | একটি প্রম্পট যা বড় ভাষার মডেলটিকে কিছু করতে বলে। |
উদাহরণ | HTML এ মার্কডাউন কোডটি অনুবাদ করুন। যেমন: মার্কডাউন: * তালিকা আইটেম এইচটিএমএল: <ul> <li> তালিকা আইটেম </li> </ul> | এই উদাহরণ প্রম্পটে প্রথম বাক্যটি একটি নির্দেশনা। প্রম্পটের বাকী অংশগুলি উদাহরণ। |
ভূমিকা | পদার্থবিজ্ঞানের পিএইচডি -তে মেশিন লার্নিং প্রশিক্ষণে কেন গ্রেডিয়েন্ট বংশোদ্ভূত ব্যবহৃত হয় তা ব্যাখ্যা করুন। | বাক্যটির প্রথম অংশটি একটি নির্দেশনা; "পদার্থবিজ্ঞানের পিএইচডি" বাক্যাংশটি ভূমিকা অংশ। |
মডেলটি সম্পূর্ণ করার জন্য আংশিক ইনপুট | যুক্তরাজ্যের প্রধানমন্ত্রী থাকেন | একটি আংশিক ইনপুট প্রম্পট হয় হঠাৎ করে শেষ হতে পারে (যেমন এই উদাহরণটি হয়) বা একটি আন্ডারস্কোর দিয়ে শেষ হতে পারে। |
একটি জেনারেটর এআই মডেল পাঠ্য, কোড, চিত্র, এম্বেডিংস , ভিডিও… প্রায় কোনও কিছুর সাথে একটি প্রম্পটে সাড়া দিতে পারে।
প্রম্পট-ভিত্তিক শেখা
নির্দিষ্ট মডেলের একটি ক্ষমতা যা তাদের স্বেচ্ছাসেবী পাঠ্য ইনপুট ( প্রম্পটস ) এর প্রতিক্রিয়াতে তাদের আচরণকে মানিয়ে নিতে সক্ষম করে। একটি সাধারণ প্রম্পট-ভিত্তিক শেখার দৃষ্টান্তে, একটি বৃহত ভাষার মডেল পাঠ্য তৈরি করে একটি প্রম্পটে সাড়া দেয়। উদাহরণস্বরূপ, ধরুন কোনও ব্যবহারকারী নিম্নলিখিত প্রম্পটে প্রবেশ করেছেন:
নিউটনের গতির তৃতীয় আইন সংক্ষিপ্ত করুন।
প্রম্পট-ভিত্তিক শিক্ষার জন্য সক্ষম একটি মডেল পূর্ববর্তী প্রম্পটের উত্তর দেওয়ার জন্য বিশেষভাবে প্রশিক্ষিত নয়। বরং, মডেলটি পদার্থবিজ্ঞান সম্পর্কে প্রচুর তথ্য "জানে", সাধারণ ভাষার নিয়ম সম্পর্কে অনেক কিছু এবং সাধারণত কার্যকর উত্তরগুলি কী তা নিয়ে আসে সে সম্পর্কে অনেক কিছু। এই জ্ঞানটি একটি (আশাবাদী) দরকারী উত্তর সরবরাহ করার জন্য যথেষ্ট। অতিরিক্ত মানব প্রতিক্রিয়া ("সেই উত্তরটি খুব জটিল ছিল" "বা" একটি প্রতিক্রিয়া কী? ") কিছু প্রম্পট-ভিত্তিক শেখার সিস্টেমগুলিকে ধীরে ধীরে তাদের উত্তরের কার্যকারিতা উন্নত করতে সক্ষম করে।
প্রম্পট ডিজাইন
প্রম্পট ইঞ্জিনিয়ারিংয়ের প্রতিশব্দ।
প্রম্পট ইঞ্জিনিয়ারিং
তৈরির শিল্পটি একটি বৃহত ভাষার মডেল থেকে কাঙ্ক্ষিত প্রতিক্রিয়াগুলি প্রকাশ করে। মানুষ প্রম্পট ইঞ্জিনিয়ারিং সম্পাদন করে। একটি বৃহত ভাষার মডেল থেকে দরকারী প্রতিক্রিয়াগুলি নিশ্চিত করার জন্য সু-কাঠামোগত প্রম্পটগুলি লেখা একটি অপরিহার্য অঙ্গ। প্রম্পট ইঞ্জিনিয়ারিং অনেকগুলি কারণের উপর নির্ভর করে:
- ডেটাসেটটি প্রাক-প্রশিক্ষণের জন্য ব্যবহৃত হত এবং সম্ভবত বড় ভাষার মডেলটিকে সূক্ষ্ম-সুর করতে ব্যবহৃত হত।
- তাপমাত্রা এবং অন্যান্য ডিকোডিং প্যারামিটারগুলি যা মডেল প্রতিক্রিয়া তৈরি করতে ব্যবহার করে।
প্রম্পট ডিজাইন প্রম্পট ইঞ্জিনিয়ারিংয়ের প্রতিশব্দ।
সহায়ক প্রম্পটগুলি লেখার বিষয়ে আরও তথ্যের জন্য প্রম্পট ডিজাইনের পরিচিতি দেখুন।
প্রম্পট টিউনিং
একটি প্যারামিটার দক্ষ টিউনিং প্রক্রিয়া যা একটি "উপসর্গ" শিখেছে যা সিস্টেমটি প্রকৃত প্রম্পটে প্রস্তুত করে।
প্রম্পট টিউনিংয়ের একটি প্রকরণ - কখনও কখনও উপসর্গ টিউনিং নামে পরিচিত - প্রতিটি স্তরে উপসর্গটি প্রস্তুত করার জন্য। বিপরীতে, বেশিরভাগ প্রম্পট টিউনিং কেবল ইনপুট স্তরটিতে একটি উপসর্গ যুক্ত করে।
আর
রেফারেন্স পাঠ্য
একটি প্রম্পটে বিশেষজ্ঞের প্রতিক্রিয়া। উদাহরণস্বরূপ, নিম্নলিখিত প্রম্পট দেওয়া:
"আপনার নাম কি?" প্রশ্নটি অনুবাদ করুন ইংরেজি থেকে ফরাসি পর্যন্ত।
একজন বিশেষজ্ঞের প্রতিক্রিয়া হতে পারে:
মন্তব্য vous applez-vous?
বিভিন্ন মেট্রিক (যেমন রাউজ ) রেফারেন্স পাঠ্যটি এমএল মডেলের উত্পন্ন পাঠ্যের সাথে মেলে এমন ডিগ্রি পরিমাপ করে।
হিউম্যান ফিডব্যাক থেকে রিইনফোর্সমেন্ট লার্নিং (RLHF)
কোনও মডেলের প্রতিক্রিয়াগুলির গুণমান উন্নত করতে মানব রেটারদের কাছ থেকে প্রতিক্রিয়া ব্যবহার করা। উদাহরণস্বরূপ, একটি আরএলএইচএফ প্রক্রিয়া ব্যবহারকারীদের একটি 👍 বা 👎 ইমোজি দিয়ে কোনও মডেলের প্রতিক্রিয়ার গুণমানকে রেট করতে বলতে পারে। সিস্টেমটি তখন সেই প্রতিক্রিয়ার ভিত্তিতে তার ভবিষ্যতের প্রতিক্রিয়াগুলি সামঞ্জস্য করতে পারে।
ভূমিকা অনুরোধ
প্রম্পটের একটি al চ্ছিক অংশ যা একটি জেনারেটর এআই মডেলের প্রতিক্রিয়ার জন্য একটি লক্ষ্য শ্রোতাদের চিহ্নিত করে। কোনও ভূমিকা প্রম্পট ছাড়াই , একটি বৃহত ভাষার মডেল এমন একটি উত্তর সরবরাহ করে যা প্রশ্ন জিজ্ঞাসা করা ব্যক্তির পক্ষে কার্যকর বা নাও হতে পারে। একটি ভূমিকা প্রম্পটের সাথে , একটি বৃহত ভাষার মডেল এমনভাবে উত্তর দিতে পারে যা নির্দিষ্ট লক্ষ্য দর্শকদের জন্য আরও উপযুক্ত এবং আরও সহায়ক। উদাহরণস্বরূপ, নিম্নলিখিত অনুরোধগুলির ভূমিকা প্রম্পট অংশটি বোল্ডফেসে রয়েছে:
- অর্থনীতিতে পিএইচডি করার জন্য এই দস্তাবেজটি সংক্ষিপ্ত করুন।
- দশ বছরের পুরানো জন্য জোয়ারগুলি কীভাবে কাজ করে তা বর্ণনা করুন।
- ২০০৮ আর্থিক সংকট ব্যাখ্যা করুন। আপনি একটি ছোট বাচ্চা, বা একটি সোনার পুনরুদ্ধারকারী হিসাবে কথা বলুন।
এস
নরম প্রম্পট টিউনিং
একটি নির্দিষ্ট কাজের জন্য একটি বৃহত ভাষার মডেল টিউন করার জন্য একটি কৌশল, রিসোর্স নিবিড় সূক্ষ্ম-সুরকরণ ছাড়াই। মডেলের সমস্ত ওজনকে পুনরায় প্রশিক্ষণ দেওয়ার পরিবর্তে, সফট প্রম্পট টিউনিং স্বয়ংক্রিয়ভাবে একই লক্ষ্য অর্জনের জন্য একটি প্রম্পট সামঞ্জস্য করে।
একটি পাঠ্য প্রম্পট দেওয়া, নরম প্রম্পট টিউনিং সাধারণত অতিরিক্ত টোকেন এম্বেডিংগুলিকে প্রম্পটে সংযুক্ত করে এবং ইনপুটটি অনুকূল করতে ব্যাকপ্রোপেশন ব্যবহার করে।
একটি "হার্ড" প্রম্পটে টোকেন এম্বেডিংয়ের পরিবর্তে প্রকৃত টোকেন রয়েছে।
টি
তাপমাত্রা
একটি হাইপারপ্যারামিটার যা কোনও মডেলের আউটপুটটির এলোমেলো ডিগ্রি নিয়ন্ত্রণ করে। উচ্চতর তাপমাত্রার ফলে আরও এলোমেলো আউটপুট হয়, যখন কম তাপমাত্রার ফলে কম এলোমেলো আউটপুট হয়।
সর্বোত্তম তাপমাত্রা নির্বাচন করা নির্দিষ্ট অ্যাপ্লিকেশন এবং মডেলের আউটপুটটির পছন্দসই বৈশিষ্ট্যের উপর নির্ভর করে। উদাহরণস্বরূপ, সৃজনশীল আউটপুট উত্পন্ন করে এমন একটি অ্যাপ্লিকেশন তৈরি করার সময় আপনি সম্ভবত তাপমাত্রা বাড়িয়ে তুলবেন। বিপরীতে, মডেলটির যথার্থতা এবং ধারাবাহিকতা উন্নত করার জন্য চিত্র বা পাঠ্যকে শ্রেণিবদ্ধ করে এমন কোনও মডেল তৈরি করার সময় আপনি সম্ভবত তাপমাত্রা কমিয়ে দেবেন।
তাপমাত্রা প্রায়শই সফটম্যাক্সের সাথে ব্যবহৃত হয়।
জেড
জিরো-শট প্রম্পটিং
এমন একটি প্রম্পট যা আপনি বড় ভাষার মডেলটি কীভাবে প্রতিক্রিয়া জানাতে চান তার উদাহরণ সরবরাহ করে না । যেমন:
একটি প্রম্পটের অংশ | নোট |
---|---|
নির্দিষ্ট দেশের সরকারী মুদ্রা কী? | আপনি যে প্রশ্নের উত্তর চান তা প্রশ্নের উত্তর দিন। |
ভারত: | আসল ক্যোয়ারী। |
বৃহত্তর ভাষার মডেল নিম্নলিখিতগুলির সাথে প্রতিক্রিয়া জানাতে পারে:
- রুপি
- INR
- ₹
- ভারতীয় রুপি
- রুপি
- ভারতীয় রুপী
সমস্ত উত্তর সঠিক, যদিও আপনি একটি নির্দিষ্ট ফর্ম্যাট পছন্দ করতে পারেন।
নিম্নলিখিত শর্তগুলির সাথে জিরো-শটকে অনুরোধ করুন এবং বিপরীতে তুলনা করুন: