মেশিন লার্নিং মডেল স্থাপনের জন্য পরীক্ষা

আপনি স্থাপন করতে প্রস্তুত! যদি শুধুমাত্র একটি মডেল স্থাপন করা একটি বড় লাল বোতাম টিপে হিসাবে সহজ ছিল. মোতায়েন করার সময়, আপনি চান যে আপনার পাইপলাইনটি চালানো, আপডেট করা এবং কোনও বাধা ছাড়াই পরিবেশন করা। এই চাহিদাগুলি এই পৃষ্ঠায় আলোচনা করা প্রয়োজনীয়তা এবং সমাধানগুলির দিকে পরিচালিত করে৷

প্রজননযোগ্য প্রশিক্ষণ সহ মডেল আপডেট পরীক্ষা করুন

কোন সন্দেহ নেই যে আপনি আপনার ইউনিকর্ন চেহারা ভবিষ্যদ্বাণীর উন্নতি চালিয়ে যেতে চান। বলুন আপনি "দিনের সময়" বৈশিষ্ট্যের জন্য ফিচার ইঞ্জিনিয়ারিং কোড রিফ্যাক্টর করেছেন। আপনি কিভাবে পরীক্ষা করবেন যে কোডটি সঠিক? আপনি আপনার মডেলকে আবার প্রশিক্ষণ দেওয়ার সিদ্ধান্ত নেন এবং দেখুন আপনি একই ফলাফল পান কিনা। ওহ না, আপনি দেখতে পাচ্ছেন যে আপনার মডেল প্রশিক্ষণ পুনরুত্পাদনযোগ্য নয়। ইউনিকর্নের উপস্থিতির ভবিষ্যদ্বাণী করা চালিয়ে যাওয়ার জন্য দৃঢ়সংকল্পবদ্ধ, আপনি আরও তদন্ত করুন। আপনি দেখতে পাচ্ছেন যে আপনি এই পদক্ষেপগুলি অনুসরণ করে প্রজননযোগ্যতা অর্জন করতে পারেন:

  • নির্ধারকভাবে র্যান্ডম নম্বর জেনারেটর (RNG) বীজ করুন। বিস্তারিত জানার জন্য, এমএল কোর্সে ডেটা প্রিপারেশন এবং ফিচার ইঞ্জিনিয়ারিং থেকে ডেটা জেনারেশনে র্যান্ডমাইজেশন দেখুন।

  • প্রতিটি রানে RNG থেকে উপাদানগুলি একই র্যান্ডম নম্বর পায় তা নিশ্চিত করতে একটি নির্দিষ্ট ক্রমে মডেল উপাদানগুলি শুরু করুন। এমএল লাইব্রেরি সাধারণত এই প্রয়োজনীয়তা স্বয়ংক্রিয়ভাবে পরিচালনা করে।

  • মডেলের গড় বেশ কয়েকটি রান।

  • সংস্করণ নিয়ন্ত্রণ ব্যবহার করুন, এমনকি প্রাথমিক পুনরাবৃত্তির জন্য, যাতে আপনি আপনার মডেল বা পাইপলাইন তদন্ত করার সময় কোড এবং পরামিতিগুলি চিহ্নিত করতে পারেন।

এমনকি এই পদক্ষেপগুলি নেওয়ার পরেও, আপনার অনির্ধারণবাদের অন্যান্য উত্স থাকতে পারে।

স্পেক্স এবং API কলের মডেল আপডেট পরীক্ষা করা হচ্ছে

ইউনিকর্ন প্রেডিক্টর 2.0 তে আপনার মডেল আপডেট করার পরে, আপনাকে API কলে যেকোনো পরিবর্তন সহ অ্যালগরিদমিক সঠিকতার জন্য নতুন মডেলটি পরীক্ষা করতে হবে। কিভাবে আলোচনা করা যাক.

API কল পরীক্ষা করা হচ্ছে

আপনি API কলগুলিতে আপডেটগুলি কীভাবে পরীক্ষা করবেন? অবশ্যই, আপনি আপনার মডেলকে পুনরায় প্রশিক্ষণ দিতে পারেন, তবে এটি সময় নিবিড়। পরিবর্তে, এলোমেলো ইনপুট ডেটা জেনারেট করতে একটি ইউনিট পরীক্ষা লিখুন এবং গ্রেডিয়েন্ট ডিসেন্টের একক ধাপ চালান। আপনি রানটাইম ত্রুটি ছাড়াই ধাপটি সম্পূর্ণ করতে চান।

অ্যালগরিদমিক সঠিকতার জন্য পরীক্ষা

একটি মডেল শুধুমাত্র সঠিকভাবে ভবিষ্যদ্বাণী করতে হবে না, তবে তা করতে হবে কারণ এটি অ্যালগরিদমিকভাবে সঠিক, ভাগ্যবান নয়। উদাহরণস্বরূপ, যদি 99% ইমেল স্প্যাম না হয়, তাহলে সমস্ত ইমেলকে স্প্যাম নয় হিসাবে শ্রেণীবদ্ধ করা সুযোগের মাধ্যমে 99% নির্ভুলতা পায়৷ অতএব, আপনাকে অ্যালগরিদমিক সঠিকতার জন্য আপনার মডেল পরীক্ষা করতে হবে। এই পদক্ষেপগুলি অনুসরণ করুন:

  • আপনার মডেলকে কয়েকটি পুনরাবৃত্তির জন্য প্রশিক্ষণ দিন এবং যাচাই করুন যে ক্ষতি কমেছে।
  • নিয়মিতকরণ ছাড়া আপনার অ্যালগরিদম প্রশিক্ষণ. যদি আপনার মডেল যথেষ্ট জটিল হয়, তাহলে এটি প্রশিক্ষণের ডেটা মুখস্থ করবে এবং আপনার প্রশিক্ষণের ক্ষতি 0-এর কাছাকাছি হবে।
  • আপনার অ্যালগরিদমের নির্দিষ্ট সাবকম্পিউটেশন পরীক্ষা করুন। উদাহরণস্বরূপ, আপনি পরীক্ষা করতে পারেন যে আপনার RNN-এর একটি অংশ ইনপুট ডেটার উপাদান প্রতি একবার চলে।

পাইপলাইন উপাদানগুলির জন্য ইন্টিগ্রেশন পরীক্ষা লিখুন

একটি ML পাইপলাইনে, একটি উপাদানের পরিবর্তন অন্যান্য উপাদানগুলিতে ত্রুটি সৃষ্টি করতে পারে। সম্পূর্ণ পাইপলাইন এন্ড-টু-এন্ড চালায় এমন একটি পরীক্ষা লিখে উপাদানগুলি একসাথে কাজ করে কিনা তা পরীক্ষা করুন। এই ধরনের পরীক্ষাকে ইন্টিগ্রেশন টেস্ট বলা হয়।

ক্রমাগত ইন্টিগ্রেশন পরীক্ষা চালানোর পাশাপাশি, নতুন মডেল এবং নতুন সফ্টওয়্যার সংস্করণগুলি পুশ করার সময় আপনার ইন্টিগ্রেশন পরীক্ষা চালানো উচিত। সম্পূর্ণ পাইপলাইন চালানোর ধীরগতি ক্রমাগত একীকরণ পরীক্ষাকে কঠিন করে তোলে। দ্রুত ইন্টিগ্রেশন পরীক্ষা চালানোর জন্য, ডেটার একটি উপসেট বা একটি সহজ মডেলের সাথে প্রশিক্ষণ দিন। বিবরণ আপনার মডেল এবং তথ্য উপর নির্ভর করে. ক্রমাগত কভারেজ পেতে, আপনি আপনার দ্রুত পরীক্ষাগুলি সামঞ্জস্য করবেন যাতে সেগুলি মডেল বা সফ্টওয়্যারের প্রতিটি নতুন সংস্করণের সাথে চলে। এদিকে, আপনার ধীরগতির পরীক্ষাগুলি পটভূমিতে ক্রমাগত চলবে।

পরিবেশন করার আগে মডেলের গুণমান যাচাই করুন

একটি নতুন মডেল সংস্করণ উৎপাদনে ঠেলে দেওয়ার আগে, গুণমানের এই দুই ধরনের অবনতির জন্য পরীক্ষা করুন:

  • আকস্মিক অবক্ষয়: নতুন সংস্করণে একটি বাগ উল্লেখযোগ্যভাবে নিম্নমানের কারণ হতে পারে। আগের সংস্করণের বিপরীতে নতুন সংস্করণের গুণমান যাচাই করে যাচাই করুন।

  • ধীরগতির অবনতি: হঠাৎ অবনতির জন্য আপনার পরীক্ষা একাধিক সংস্করণে মডেলের গুণমানে ধীরগতির অবনতি সনাক্ত করতে পারে না। পরিবর্তে, একটি বৈধতা ডেটাসেটে আপনার মডেলের ভবিষ্যদ্বাণীগুলি একটি নির্দিষ্ট থ্রেশহোল্ড পূরণ করে তা নিশ্চিত করুন৷ যদি আপনার বৈধতা ডেটাসেট লাইভ ডেটা থেকে বিচ্যুত হয়, তাহলে আপনার বৈধতা ডেটাসেট আপডেট করুন এবং নিশ্চিত করুন যে আপনার মডেল এখনও একই মানের থ্রেশহোল্ড পূরণ করছে।

পরিবেশন করার আগে মডেল-ইনফ্রা সামঞ্জস্যতা যাচাই করুন

যদি আপনার মডেল আপনার সার্ভারের চেয়ে দ্রুত আপডেট করা হয়, তাহলে আপনার মডেলের আপনার সার্ভার থেকে বিভিন্ন সফ্টওয়্যার নির্ভরতা থাকবে, সম্ভাব্য অসঙ্গতি সৃষ্টি করবে। মডেলটিকে সার্ভারের একটি স্যান্ডবক্স করা সংস্করণে স্টেজ করে মডেল দ্বারা ব্যবহৃত ক্রিয়াকলাপগুলি সার্ভারে উপস্থিত রয়েছে তা নিশ্চিত করুন৷