সমস্যাটি বুঝতে, নিম্নলিখিত কাজগুলি সম্পাদন করুন:
- আপনি যে পণ্যটি বিকাশ করছেন বা রিফ্যাক্টর করছেন তার লক্ষ্যটি বলুন।
- ভবিষ্যদ্বাণীমূলক এমএল, জেনারেটিভ এআই, বা নন-এমএল সমাধান ব্যবহার করে লক্ষ্যটি সর্বোত্তম সমাধান করা হয়েছে কিনা তা নির্ধারণ করুন।
- আপনি যদি একটি ভবিষ্যদ্বাণীমূলক ML পদ্ধতি ব্যবহার করেন তবে আপনার কাছে একটি মডেলকে প্রশিক্ষণের জন্য প্রয়োজনীয় ডেটা রয়েছে তা যাচাই করুন।
লক্ষ্য বলুন
নন-এমএল পদে আপনার লক্ষ্য উল্লেখ করে শুরু করুন। লক্ষ্য হল প্রশ্নের উত্তর, "আমি কী অর্জন করার চেষ্টা করছি?"
নিম্নোক্ত সারণীতে কাল্পনিক অ্যাপের লক্ষ্য স্পষ্টভাবে বলা হয়েছে:
আবেদন | গোল |
---|---|
আবহাওয়া অ্যাপ | একটি ভৌগলিক অঞ্চলের জন্য ছয়-ঘণ্টার বৃদ্ধিতে বৃষ্টিপাত গণনা করুন। |
ফ্যাশন অ্যাপ | বিভিন্ন শার্ট ডিজাইন তৈরি করুন। |
ভিডিও অ্যাপ | দরকারী ভিডিও সুপারিশ. |
মেল অ্যাপ | স্প্যাম সনাক্ত করুন. |
আর্থিক অ্যাপ | একাধিক সংবাদ সূত্র থেকে আর্থিক তথ্য সংক্ষিপ্ত করুন। |
মানচিত্র অ্যাপ্লিকেশন | ভ্রমণের সময় গণনা করুন। |
ব্যাংকিং অ্যাপ | প্রতারণামূলক লেনদেন চিহ্নিত করুন। |
ডাইনিং অ্যাপ | একটি রেস্টুরেন্টের মেনু দ্বারা রন্ধনপ্রণালী সনাক্ত করুন. |
ইকমার্স অ্যাপ | সহায়ক উত্তর সহ পর্যালোচনার উত্তর দিন। |
ML-এর জন্য পরিষ্কার ব্যবহারের ক্ষেত্রে
কেউ কেউ ML কে একটি সার্বজনীন টুল হিসাবে দেখেন যা সমস্ত সমস্যার জন্য প্রয়োগ করা যেতে পারে। বাস্তবে, এমএল একটি বিশেষ সরঞ্জাম যা শুধুমাত্র বিশেষ সমস্যার জন্য উপযুক্ত। আপনি একটি জটিল এমএল সমাধান বাস্তবায়ন করতে চান না যখন একটি সহজ নন-এমএল সমাধান কাজ করবে।
এমএল সিস্টেমগুলিকে দুটি বিস্তৃত বিভাগে ভাগ করা যেতে পারে: ভবিষ্যদ্বাণীমূলক এমএল এবং জেনারেটিভ এআই । নিম্নলিখিত সারণী তাদের সংজ্ঞায়িত বৈশিষ্ট্য তালিকাভুক্ত করে:
ইনপুট | আউটপুট | প্রশিক্ষণ কৌশল | |
---|---|---|---|
ভবিষ্যদ্বাণীমূলক এমএল | পাঠ্য ছবি অডিও ভিডিও সংখ্যাসূচক | একটি ভবিষ্যদ্বাণী করে, উদাহরণস্বরূপ, একটি ইমেলকে স্প্যাম হিসাবে শ্রেণীবদ্ধ করা বা স্প্যাম নয়, আগামীকালের বৃষ্টিপাত অনুমান করা, বা একটি স্টকের দামের পূর্বাভাস দেওয়া৷ আউটপুট সাধারণত বাস্তবতার বিরুদ্ধে যাচাই করা যেতে পারে। | সাধারণত একটি নির্দিষ্ট কাজ সম্পাদন করার জন্য তত্ত্বাবধানে থাকা, তত্ত্বাবধানহীন, বা শক্তিবৃদ্ধি শেখার মডেলকে প্রশিক্ষণ দিতে প্রচুর ডেটা ব্যবহার করে। |
জেনারেটিভ এআই | পাঠ্য ছবি অডিও ভিডিও সংখ্যাসূচক | ব্যবহারকারীর অভিপ্রায়ের উপর ভিত্তি করে আউটপুট তৈরি করে, উদাহরণস্বরূপ, একটি নিবন্ধ সংক্ষিপ্ত করা, বা একটি অডিও ক্লিপ বা ছোট ভিডিও তৈরি করা। | অনুপস্থিত ডেটা পূরণ করার জন্য একটি বড় ভাষা মডেল বা চিত্র জেনারেটরকে প্রশিক্ষণ দিতে সাধারণত প্রচুর লেবেলবিহীন ডেটা ব্যবহার করে। মডেলটি তারপরে এমন কাজগুলির জন্য ব্যবহার করা যেতে পারে যেগুলিকে ফিল-ইন-দ্য-ফাঁকা কাজ হিসাবে ফ্রেম করা যেতে পারে, বা শ্রেণীবিভাগের মতো কিছু নির্দিষ্ট কাজের জন্য লেবেলযুক্ত ডেটাতে প্রশিক্ষণ দিয়ে এটিকে সূক্ষ্ম-টিউন করা যেতে পারে। |
এমএল সঠিক পদ্ধতির বিষয়টি নিশ্চিত করতে, প্রথমে যাচাই করুন যে আপনার বর্তমান নন-এমএল সমাধানটি অপ্টিমাইজ করা হয়েছে। আপনার যদি একটি নন-এমএল সমাধান বাস্তবায়িত না থাকে, তাহলে হিউরিস্টিক ব্যবহার করে ম্যানুয়ালি সমস্যাটি সমাধান করার চেষ্টা করুন।
নন-এমএল সমাধান হল আপনার সমস্যার জন্য ML একটি ভাল ব্যবহারের ক্ষেত্রে কিনা তা নির্ধারণ করতে আপনি যে বেঞ্চমার্ক ব্যবহার করবেন। একটি এমএল ওয়ানের সাথে একটি নন-এমএল পদ্ধতির তুলনা করার সময় নিম্নলিখিত প্রশ্নগুলি বিবেচনা করুন:
গুণমান এমএল সমাধান কতটা ভালো হতে পারে বলে আপনি মনে করেন? আপনি যদি মনে করেন যে একটি এমএল সমাধান শুধুমাত্র একটি ছোট উন্নতি হতে পারে, তাহলে এটি নির্দেশ করতে পারে যে বর্তমান সমাধানটি সর্বোত্তম।
খরচ এবং রক্ষণাবেক্ষণ । স্বল্প এবং দীর্ঘমেয়াদী উভয় ক্ষেত্রেই এমএল সমাধান কতটা ব্যয়বহুল? কিছু ক্ষেত্রে, গণনা সংস্থান এবং এমএল বাস্তবায়নের জন্য সময়ের পরিপ্রেক্ষিতে এটি উল্লেখযোগ্যভাবে বেশি খরচ করে। নিম্নলিখিত প্রশ্ন বিবেচনা করুন:
- এমএল সমাধান কি খরচ বৃদ্ধির ন্যায্যতা দিতে পারে? মনে রাখবেন যে বড় সিস্টেমে ছোট উন্নতিগুলি সহজেই একটি ML সমাধান বাস্তবায়নের খরচ এবং রক্ষণাবেক্ষণকে ন্যায্যতা দিতে পারে।
- সমাধান কত রক্ষণাবেক্ষণ প্রয়োজন হবে? অনেক ক্ষেত্রে, ML বাস্তবায়নের জন্য দীর্ঘমেয়াদী রক্ষণাবেক্ষণের প্রয়োজন।
- আপনার পণ্যের কি ML দক্ষতা সহ লোকেদের প্রশিক্ষণ বা নিয়োগে সহায়তা করার সংস্থান আছে?
আপনার বোঝার পরীক্ষা করুন
ভবিষ্যদ্বাণীমূলক এমএল এবং ডেটা
ডেটা হল ভবিষ্যদ্বাণীমূলক ML এর চালিকা শক্তি। ভাল ভবিষ্যদ্বাণী করার জন্য, আপনার এমন ডেটার প্রয়োজন যাতে ভবিষ্যদ্বাণী করার ক্ষমতা সহ বৈশিষ্ট্য রয়েছে৷ আপনার ডেটাতে নিম্নলিখিত বৈশিষ্ট্য থাকা উচিত:
প্রচুর । আপনার ডেটাসেটে যত বেশি প্রাসঙ্গিক এবং দরকারী উদাহরণ, আপনার মডেল তত ভালো হবে।
সামঞ্জস্যপূর্ণ এবং নির্ভরযোগ্য । ধারাবাহিকভাবে এবং নির্ভরযোগ্যভাবে সংগ্রহ করা ডেটা থাকা একটি ভাল মডেল তৈরি করবে। উদাহরণস্বরূপ, একটি ML-ভিত্তিক আবহাওয়া মডেল একই নির্ভরযোগ্য যন্ত্র থেকে বহু বছর ধরে সংগৃহীত ডেটা থেকে উপকৃত হবে।
বিশ্বস্ত । আপনার ডেটা কোথা থেকে আসবে তা বুঝুন। ডেটা কি আপনি নিয়ন্ত্রণ করেন এমন বিশ্বস্ত উত্স থেকে হবে, যেমন আপনার পণ্যের লগ, নাকি অন্য ML সিস্টেমের আউটপুটের মতো আপনার কাছে খুব বেশি অন্তর্দৃষ্টি নেই এমন উত্স থেকে হবে?
উপলব্ধ নিশ্চিত করুন যে সমস্ত ইনপুট সঠিক বিন্যাসে ভবিষ্যদ্বাণীর সময়ে উপলব্ধ। ভবিষ্যদ্বাণীর সময় নির্দিষ্ট বৈশিষ্ট্যের মানগুলি পাওয়া কঠিন হলে, আপনার ডেটাসেটগুলি থেকে সেই বৈশিষ্ট্যগুলি বাদ দিন।
সঠিক । বড় ডেটাসেটে, এটা অনিবার্য যে কিছু লেবেলে ভুল মান থাকবে, কিন্তু যদি লেবেলের একটি ছোট শতাংশের বেশি ভুল হয়, তাহলে মডেলটি খারাপ ভবিষ্যদ্বাণী তৈরি করবে।
প্রতিনিধি । ডেটাসেটগুলি যথাসম্ভব বাস্তব জগতের প্রতিনিধি হওয়া উচিত। অন্য কথায়, ডেটাসেটগুলিকে সঠিকভাবে ইভেন্ট, ব্যবহারকারীর আচরণ এবং/অথবা বাস্তব জগতের ঘটনাগুলিকে মডেল করা উচিত। যখন মডেলটিকে বাস্তব-বিশ্বের ভবিষ্যদ্বাণী করতে বলা হয় তখন অপ্রতিনিধিত্বহীন ডেটাসেটের প্রশিক্ষণ খারাপ কার্যক্ষমতার কারণ হতে পারে।
আপনি যদি প্রয়োজনীয় বিন্যাসে আপনার প্রয়োজনীয় ডেটা পেতে না পারেন তবে আপনার মডেলটি খারাপ ভবিষ্যদ্বাণী করবে।
ভবিষ্যদ্বাণী করার ক্ষমতা
একটি মডেল ভালো ভবিষ্যদ্বাণী করার জন্য, আপনার ডেটাসেটের বৈশিষ্ট্যগুলির ভবিষ্যদ্বাণী করার ক্ষমতা থাকা উচিত৷ একটি বৈশিষ্ট্য একটি লেবেলের সাথে যত বেশি সম্পর্কযুক্ত, এটির পূর্বাভাস দেওয়ার সম্ভাবনা তত বেশি।
কিছু বৈশিষ্ট্য অন্যদের তুলনায় বেশি ভবিষ্যদ্বাণী করার ক্ষমতা থাকবে। উদাহরণস্বরূপ, একটি আবহাওয়া ডেটাসেটে, cloud_coverage
, temperature
এবং dew_point
মতো বৈশিষ্ট্যগুলি moon_phase
বা day_of_week
চেয়ে বৃষ্টির ভাল পূর্বাভাস দেয়। ভিডিও অ্যাপের উদাহরণের জন্য, আপনি অনুমান করতে পারেন যে video_description
, length
এবং views
মতো বৈশিষ্ট্যগুলি একটি ভাল ভবিষ্যদ্বাণীকারী হতে পারে যেগুলি একজন ব্যবহারকারী দেখতে চান৷
সচেতন থাকুন যে একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা পরিবর্তন হতে পারে কারণ প্রসঙ্গ বা ডোমেন পরিবর্তন হয়। উদাহরণস্বরূপ, ভিডিও অ্যাপে, upload_date
এর মতো একটি বৈশিষ্ট্য—সাধারণভাবে—লেবেলের সাথে দুর্বলভাবে সম্পর্কযুক্ত হতে পারে। যাইহোক, গেমিং ভিডিওর সাব-ডোমেনে, upload_date
লেবেলের সাথে দৃঢ়ভাবে সম্পর্কযুক্ত হতে পারে।
কোন বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা আছে তা নির্ধারণ করা একটি সময়সাপেক্ষ প্রক্রিয়া হতে পারে। আপনি ম্যানুয়ালি একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণী করার ক্ষমতা অন্বেষণ করতে পারেন একটি মডেলকে প্রশিক্ষণের সময় এটিকে সরিয়ে এবং যোগ করে৷ আপনি পিয়ারসন পারস্পরিক সম্পর্ক , সামঞ্জস্যপূর্ণ পারস্পরিক তথ্য (AMI) এবং শ্যাপলি মান এর মতো অ্যালগরিদম ব্যবহার করে একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণীমূলক শক্তি খুঁজে বের করতে স্বয়ংক্রিয়ভাবে করতে পারেন, যা একটি বৈশিষ্ট্যের ভবিষ্যদ্বাণীমূলক শক্তি বিশ্লেষণের জন্য একটি সংখ্যাসূচক মূল্যায়ন প্রদান করে।
আপনার বোঝার পরীক্ষা করুন
আপনার ডেটাসেটগুলি বিশ্লেষণ এবং প্রস্তুত করার বিষয়ে আরও নির্দেশনার জন্য, মেশিন লার্নিংয়ের জন্য ডেটা প্রস্তুতি এবং বৈশিষ্ট্য ইঞ্জিনিয়ারিং দেখুন।
ভবিষ্যদ্বাণী বনাম কর্ম
আপনি যদি ভবিষ্যদ্বাণীটিকে এমন একটি ক্রিয়াতে পরিণত করতে না পারেন যা ব্যবহারকারীদের সাহায্য করে তবে কোনও কিছুর ভবিষ্যদ্বাণী করার কোনও মূল্য নেই৷ অর্থাৎ, আপনার পণ্যটি মডেলের আউটপুট থেকে পদক্ষেপ নেওয়া উচিত।
উদাহরণ স্বরূপ, একটি মডেল যা ভবিষ্যদ্বাণী করে যে ব্যবহারকারী একটি ভিডিওকে উপযোগী মনে করবেন কিনা সেটিকে এমন একটি অ্যাপে ফিড করা উচিত যা দরকারী ভিডিওগুলি সুপারিশ করে৷ একটি মডেল যা ভবিষ্যদ্বাণী করে যে বৃষ্টি হবে কিনা একটি আবহাওয়া অ্যাপে খাওয়ানো উচিত।
আপনার বোঝার পরীক্ষা করুন
নিম্নলিখিত পরিস্থিতির উপর ভিত্তি করে, ML ব্যবহার করা সমস্যাটির সর্বোত্তম পদ্ধতি কিনা তা নির্ধারণ করুন।
একটি বড় প্রতিষ্ঠানের একটি ইঞ্জিনিয়ারিং দল ইনকামিং ফোন কল পরিচালনার জন্য দায়ী।
লক্ষ্য : বর্তমান কল ভলিউম অনুযায়ী কলকারীদের কতক্ষণ অপেক্ষা করতে হবে তা জানানো।
তাদের কাছে কোন সমাধান নেই, কিন্তু তারা মনে করে একটি হিউরিস্টিক হবে হোল্ডে থাকা গ্রাহকদের বর্তমান সংখ্যাকে ফোনের উত্তর দিচ্ছেন এমন কর্মীদের সংখ্যা দিয়ে ভাগ করা এবং তারপর 10 মিনিট দ্বারা গুণ করা। যাইহোক, তারা জানে যে কিছু গ্রাহকের সমস্যা দুই মিনিটের মধ্যে সমাধান হয়ে গেছে, অন্যরা 45 মিনিট বা তার বেশি সময় নিতে পারে।
তাদের হিউরিস্টিক সম্ভবত তাদের একটি সুনির্দিষ্ট যথেষ্ট সংখ্যা পাবে না। তারা নিম্নলিখিত কলামগুলির সাথে একটি ডেটাসেট তৈরি করতে পারে: number_of_callcenter_phones
, user_issue
, time_to_resolve
, call_time
, time_on_hold
।
time_on_hold
।