meridian.data.input_data.InputData

মেরিডিয়ান দ্বারা সমর্থিত ফর্ম্যাটে বিজ্ঞাপন ডেটার জন্য একটি ডেটা কন্টেনার৷

kpi মাত্রার একটি DataArray (n_geos, n_times) যাতে অ-নেতিবাচক নির্ভরশীল ভেরিয়েবল থাকে। সাধারণত এটি বিক্রি হওয়া ইউনিটের সংখ্যা, তবে এটি যে কোনো মেট্রিক হতে পারে, যেমন রাজস্ব বা রূপান্তর।
kpi_type KPI একটি 'revenue' বা 'non-revenue' ধরনের কিনা তা নির্দেশ করে একটি স্ট্রিং। যখন kpi_type 'non-revenue' হয় এবং revenue_per_kpi বিদ্যমান থাকে, তখন ROI ক্রমাঙ্কন ব্যবহার করা হয় এবং বিশ্লেষণটি রাজস্বের উপর চালানো হয়। যখন একই kpi_type জন্য revenue_per_kpi বিদ্যমান না থাকে, তখন কাস্টম ROI ক্রমাঙ্কন ব্যবহার করা হয় এবং বিশ্লেষণটি KPI-তে চালানো হয়।
controls কন্ট্রোল ভেরিয়েবল মান সমন্বিত মাত্রার একটি DataArray (n_geos, n_times, n_controls)
population প্রতিটি গোষ্ঠীর জনসংখ্যা ধারণ করে মাত্রার একটি ডেটা অ্যারে (n_geos,) । এই ভেরিয়েবলটি মডেলিংয়ের জন্য কেপিআই এবং মিডিয়া স্কেল করতে ব্যবহৃত হয়।
revenue_per_kpi মাত্রার একটি ঐচ্ছিক ডেটা অ্যারে (n_geos, n_times) যার মধ্যে প্রতি KPI ইউনিটের গড় আয়ের পরিমাণ রয়েছে। যদিও মডেলিং kpi তে করা হয়, মডেল বিশ্লেষণ এবং অপ্টিমাইজেশান করা হয় KPI * revenue_per_kpi (রাজস্ব), যদি এই মান উপলব্ধ থাকে। kpi যদি রাজস্বের সাথে মিলে যায়, তাহলে একটি অ্যারে স্বয়ংক্রিয়ভাবে পাস হয়।
media মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_media_channels) যাতে অ-নেতিবাচক মিডিয়া এক্সিকিউশন মান রয়েছে। সাধারণত এগুলি ইম্প্রেশন, তবে এটি যেকোন মেট্রিক হতে পারে, যেমন খরচ বা ক্লিক৷ n_media_timesn_times প্রয়োজন, এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হতে হবে। পিছিয়ে যাওয়া প্রভাবের কারণে, আমরা সুপারিশ করি যে মিডিয়ার জন্য সময় উইন্ডোতে এই উইন্ডোর আগে max_lag পর্যন্ত অতিরিক্ত সময় থাকতে হবে। যদি n_media_times < n_times + max_lag হয়, মডেলটি কার্যকরভাবে মিডিয়া ইতিহাসকে অভিহিত করে। যদি n_media_times > n_times + max_lag হয়, তাহলে শুধুমাত্র চূড়ান্ত n_times + max_lag পিরিয়ডগুলি মডেলের সাথে মানানসই হয়। media এবং media_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে একটি পাস করা হয়, তবে অন্যটি ঐচ্ছিক নয়।
media_spend প্রতিটি মিডিয়া চ্যানেলের খরচ ধারণকারী একটি ঐচ্ছিক DataArray . এটি ROI গণনার জন্য হর হিসাবে ব্যবহৃত হয়। ডেটা অ্যারে আকৃতি হতে পারে (n_geos, n_times, n_media_channels) বা (n_media_channels,) যদি ডেটা geo এবং time মাত্রার উপর একত্রিত হয়। kpi এর টাইম উইন্ডোর সাথে মোট খরচ সারিবদ্ধ করুন এবং ডেটা controls , এটি সেই সময় উইন্ডো যার উপর ROI সংখ্যার বর্ধিত আয় গণনা করা হয়। ক্রমবর্ধমান রাজস্ব এই টাইম উইন্ডোর আগে মিডিয়া এক্সিকিউশন দ্বারা প্রভাবিত হয়, পিছিয়ে যাওয়া প্রভাবগুলির মাধ্যমে। media এবং media_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে একটি পাস করা হয়, তবে অন্যটি ঐচ্ছিক নয়।
reach মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_rf_channels) যাতে অ-নেতিবাচক reach মান থাকে। এটি প্রয়োজনীয় যে n_media_timesn_times , এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হওয়া আবশ্যক। টাইম উইন্ডোতে অবশ্যই kpi এর টাইম উইন্ডো এবং ডাটা controls করা আবশ্যক, কিন্তু kpi এবং controls ডেটার টাইম উইন্ডোর আগে পিছিয়ে থাকা সময়সীমা অন্তর্ভুক্ত করা ঐচ্ছিক। যদি পিছিয়ে থাকা নাগালের অন্তর্ভুক্ত না হয়, অথবা যদি পিছিয়ে থাকা পৌঁছাতে max_lag সময়কালের চেয়ে কম থাকে, তাহলে মডেলটি অ্যাডস্টককে গণনা করে যে অনুমান করে যে পৌঁছনোর কার্য সম্পাদন প্রথম পর্যবেক্ষিত সময়ের আগে শূন্য। আমরা n_times + max_lag টাইম পিরিয়ডগুলি অন্তর্ভুক্ত করার পরামর্শ দিই, যদি না max_lag এর মান নিষিদ্ধভাবে বড় হয়। যদি শুধুমাত্র media ডেটা ব্যবহার করা হয়, তাহলে reach হবে Nonereach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়।
frequency মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_rf_channels) যাতে অ-নেতিবাচক frequency মান রয়েছে। এটি প্রয়োজনীয় যে n_media_timesn_times , এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হওয়া আবশ্যক। টাইম উইন্ডোতে অবশ্যই kpi এর টাইম উইন্ডো এবং ডাটা controls করা আবশ্যক, কিন্তু kpi এবং controls ডেটার টাইম উইন্ডোর আগে পিছিয়ে থাকা সময়সীমা অন্তর্ভুক্ত করা ঐচ্ছিক। যদি ল্যাগড ফ্রিকোয়েন্সি অন্তর্ভুক্ত না করা হয়, অথবা যদি ল্যাগড ফ্রিকোয়েন্সি max_lag সময়কালের চেয়ে কম থাকে, তাহলে মডেলটি Adstock গণনা করে যে ফ্রিকোয়েন্সি এক্সিকিউশন প্রথম পর্যবেক্ষণ করা সময়ের আগে শূন্য। আমরা n_times + max_lag টাইম পিরিয়ডগুলি অন্তর্ভুক্ত করার পরামর্শ দিই, যদি না max_lag এর মান নিষিদ্ধভাবে বড় হয়। যদি শুধুমাত্র media ডেটা ব্যবহার করা হয়, তাহলে frequency None হবে। reach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়।
rf_spend একটি ঐচ্ছিক DataArray যাতে প্রতিটি নাগালের এবং ফ্রিকোয়েন্সি চ্যানেলের খরচ থাকে। এটি ROI গণনার জন্য হর হিসাবে ব্যবহৃত হয়। DataArray আকার হতে পারে (n_rf_channels,) , (n_geos, n_times, n_rf_channels) , অথবা (n_geos, n_rf_channels) । ব্যয়টি জিও এবং/অথবা সময়ের মাত্রার উপর একত্রিত হওয়া উচিত যা প্রতিনিধিত্ব করা হয় না। আমরা সুপারিশ করি যে মোট ব্যয় kpi এর টাইম উইন্ডোর সাথে সারিবদ্ধ করে এবং ডেটা controls , যেটি সময় উইন্ডো যার উপর ROI সংখ্যার ক্রমবর্ধমান প্রভাব গণনা করা হয়)। যাইহোক, নোট করুন যে ক্রমবর্ধমান প্রভাব এই টাইম উইন্ডোর আগে মিডিয়া এক্সিকিউশন দ্বারা প্রভাবিত হয়, ল্যাগড ইফেক্টের মাধ্যমে, এবং টাইম উইন্ডোর সময় এক্সিকিউট করা মিডিয়ার টাইম উইন্ডোর বাইরে ল্যাগড ইফেক্টগুলি বাদ দেয়। শুধুমাত্র media ডেটা ব্যবহার করা হলে, rf_spend None হবে না। reach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়।
control_variable নিয়ন্ত্রণ পরিবর্তনশীল মাত্রা প্রদান করে।
geo জিও ডাইমেনশন প্রদান করে।
media_channel মিডিয়া চ্যানেলের মাত্রা প্রদান করে।
media_spend_has_geo_dimension media_spend অ্যারের একটি জিও মাত্রা আছে কিনা তা পরীক্ষা করে।
media_spend_has_time_dimension media_spend অ্যারের একটি সময় মাত্রা আছে কিনা তা পরীক্ষা করে।
media_time মিডিয়া সময় মাত্রা স্থানাঙ্ক প্রদান করে।
media_time_coordinates একটি TimeCoordinates র‍্যাপারে মিডিয়া সময়ের মাত্রা প্রদান করে।
rf_channel RF চ্যানেলের মাত্রা প্রদান করে।
rf_spend_has_geo_dimension rf_spend অ্যারের একটি জিও মাত্রা আছে কিনা তা পরীক্ষা করে।
rf_spend_has_time_dimension rf_spend অ্যারের একটি সময় মাত্রা আছে কিনা তা পরীক্ষা করে।
time সময় মাত্রা স্থানাঙ্ক প্রদান করে।
time_coordinates একটি TimeCoordinates র‍্যাপারে (KPI) সময়ের মাত্রা প্রদান করে।

পদ্ধতি

as_dataset

উৎস দেখুন

একটি একক xarray.Dataset অবজেক্ট হিসাবে ডেটা প্রদান করে।

get_all_channels

উৎস দেখুন

মিডিয়া এবং RF উভয় সহ সমস্ত চ্যানেলের মাত্রা প্রদান করে।

get_all_media_and_rf

উৎস দেখুন

মিডিয়া এবং RF উভয় সহ মিডিয়া এক্সিকিউশনের সমস্ত মান প্রদান করে।

যদি মডেলিং এর জন্য মিডিয়া, পৌছানো এবং ফ্রিকোয়েন্সি ব্যবহার করা হয়, তাহলে পৌঁছানোর * ফ্রিকোয়েন্সি মিডিয়ার শেষ পর্যন্ত সংযুক্ত করা হয়।

রিটার্নস
np.ndarray মাত্রা সহ (n_geos, n_media_times, n_channels) প্রতিটি media_channel বা rf_channel জন্য মিডিয়া বা পৌঁছানোর * ফ্রিকোয়েন্সি ধারণকারী।

get_n_top_largest_geos

উৎস দেখুন

জনসংখ্যা অনুসারে বৃহত্তম জিওসের নির্দিষ্ট সংখ্যা খুঁজে বের করে।

আর্গস
num_geos জনসংখ্যার ভিত্তিতে প্রত্যাবর্তনের জন্য শীর্ষস্থানীয় বৃহত্তম জিওর সংখ্যা৷

রিটার্নস
শীর্ষস্থানীয় বৃহত্তম জিওগুলির নির্দিষ্ট সংখ্যার একটি তালিকা৷

get_total_spend

উৎস দেখুন

media_spend এবং rf_spend সহ মোট খরচ ফেরত দেয়।

__eq__

স্ব== মান ফেরত দিন।

ফ্রিকোয়েন্সি None
মিডিয়া None
মিডিয়া_ব্যয় None
নাগাল None
আয়_প্রতি_কেপিআই None
rf_spend None