meridian.data.input_data.InputData
সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন
আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।
মেরিডিয়ান দ্বারা সমর্থিত ফর্ম্যাটে বিজ্ঞাপন ডেটার জন্য একটি ডেটা কন্টেনার৷
meridian.data.input_data.InputData(
kpi: xr.DataArray,
kpi_type: str,
controls: xr.DataArray,
population: xr.DataArray,
revenue_per_kpi: (xr.DataArray | None) = None,
media: (xr.DataArray | None) = None,
media_spend: (xr.DataArray | None) = None,
reach: (xr.DataArray | None) = None,
frequency: (xr.DataArray | None) = None,
rf_spend: (xr.DataArray | None) = None
)
গুণাবলী |
---|
kpi | মাত্রার একটি DataArray (n_geos, n_times) যাতে অ-নেতিবাচক নির্ভরশীল ভেরিয়েবল থাকে। সাধারণত এটি বিক্রি হওয়া ইউনিটের সংখ্যা, তবে এটি যে কোনো মেট্রিক হতে পারে, যেমন রাজস্ব বা রূপান্তর। |
kpi_type | KPI একটি 'revenue' বা 'non-revenue' ধরনের কিনা তা নির্দেশ করে একটি স্ট্রিং। যখন kpi_type 'non-revenue' হয় এবং revenue_per_kpi বিদ্যমান থাকে, তখন ROI ক্রমাঙ্কন ব্যবহার করা হয় এবং বিশ্লেষণটি রাজস্বের উপর চালানো হয়। যখন একই kpi_type জন্য revenue_per_kpi বিদ্যমান না থাকে, তখন কাস্টম ROI ক্রমাঙ্কন ব্যবহার করা হয় এবং বিশ্লেষণটি KPI-তে চালানো হয়। |
controls | কন্ট্রোল ভেরিয়েবল মান সমন্বিত মাত্রার একটি DataArray (n_geos, n_times, n_controls) । |
population | প্রতিটি গোষ্ঠীর জনসংখ্যা ধারণ করে মাত্রার একটি ডেটা অ্যারে (n_geos,) । এই ভেরিয়েবলটি মডেলিংয়ের জন্য কেপিআই এবং মিডিয়া স্কেল করতে ব্যবহৃত হয়। |
revenue_per_kpi | মাত্রার একটি ঐচ্ছিক ডেটা অ্যারে (n_geos, n_times) যার মধ্যে প্রতি KPI ইউনিটের গড় আয়ের পরিমাণ রয়েছে। যদিও মডেলিং kpi তে করা হয়, মডেল বিশ্লেষণ এবং অপ্টিমাইজেশান করা হয় KPI * revenue_per_kpi (রাজস্ব), যদি এই মান উপলব্ধ থাকে। kpi যদি রাজস্বের সাথে মিলে যায়, তাহলে একটি অ্যারে স্বয়ংক্রিয়ভাবে পাস হয়। |
media | মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_media_channels) যাতে অ-নেতিবাচক মিডিয়া এক্সিকিউশন মান রয়েছে। সাধারণত এগুলি ইম্প্রেশন, তবে এটি যেকোন মেট্রিক হতে পারে, যেমন খরচ বা ক্লিক৷ n_media_times ≥ n_times প্রয়োজন, এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হতে হবে। পিছিয়ে যাওয়া প্রভাবের কারণে, আমরা সুপারিশ করি যে মিডিয়ার জন্য সময় উইন্ডোতে এই উইন্ডোর আগে max_lag পর্যন্ত অতিরিক্ত সময় থাকতে হবে। যদি n_media_times < n_times + max_lag হয়, মডেলটি কার্যকরভাবে মিডিয়া ইতিহাসকে অভিহিত করে। যদি n_media_times > n_times + max_lag হয়, তাহলে শুধুমাত্র চূড়ান্ত n_times + max_lag পিরিয়ডগুলি মডেলের সাথে মানানসই হয়। media এবং media_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে একটি পাস করা হয়, তবে অন্যটি ঐচ্ছিক নয়। |
media_spend | প্রতিটি মিডিয়া চ্যানেলের খরচ ধারণকারী একটি ঐচ্ছিক DataArray . এটি ROI গণনার জন্য হর হিসাবে ব্যবহৃত হয়। ডেটা অ্যারে আকৃতি হতে পারে (n_geos, n_times, n_media_channels) বা (n_media_channels,) যদি ডেটা geo এবং time মাত্রার উপর একত্রিত হয়। kpi এর টাইম উইন্ডোর সাথে মোট খরচ সারিবদ্ধ করুন এবং ডেটা controls , এটি সেই সময় উইন্ডো যার উপর ROI সংখ্যার বর্ধিত আয় গণনা করা হয়। ক্রমবর্ধমান রাজস্ব এই টাইম উইন্ডোর আগে মিডিয়া এক্সিকিউশন দ্বারা প্রভাবিত হয়, পিছিয়ে যাওয়া প্রভাবগুলির মাধ্যমে। media এবং media_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে একটি পাস করা হয়, তবে অন্যটি ঐচ্ছিক নয়। |
reach | মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_rf_channels) যাতে অ-নেতিবাচক reach মান থাকে। এটি প্রয়োজনীয় যে n_media_times ≥ n_times , এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হওয়া আবশ্যক। টাইম উইন্ডোতে অবশ্যই kpi এর টাইম উইন্ডো এবং ডাটা controls করা আবশ্যক, কিন্তু kpi এবং controls ডেটার টাইম উইন্ডোর আগে পিছিয়ে থাকা সময়সীমা অন্তর্ভুক্ত করা ঐচ্ছিক। যদি পিছিয়ে থাকা নাগালের অন্তর্ভুক্ত না হয়, অথবা যদি পিছিয়ে থাকা পৌঁছাতে max_lag সময়কালের চেয়ে কম থাকে, তাহলে মডেলটি অ্যাডস্টককে গণনা করে যে অনুমান করে যে পৌঁছনোর কার্য সম্পাদন প্রথম পর্যবেক্ষিত সময়ের আগে শূন্য। আমরা n_times + max_lag টাইম পিরিয়ডগুলি অন্তর্ভুক্ত করার পরামর্শ দিই, যদি না max_lag এর মান নিষিদ্ধভাবে বড় হয়। যদি শুধুমাত্র media ডেটা ব্যবহার করা হয়, তাহলে reach হবে None । reach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়। |
frequency | মাত্রার একটি ঐচ্ছিক DataArray (n_geos, n_media_times, n_rf_channels) যাতে অ-নেতিবাচক frequency মান রয়েছে। এটি প্রয়োজনীয় যে n_media_times ≥ n_times , এবং চূড়ান্ত n_times সময়কাল অবশ্যই kpi এবং controls সময় উইন্ডোর সাথে সারিবদ্ধ হওয়া আবশ্যক। টাইম উইন্ডোতে অবশ্যই kpi এর টাইম উইন্ডো এবং ডাটা controls করা আবশ্যক, কিন্তু kpi এবং controls ডেটার টাইম উইন্ডোর আগে পিছিয়ে থাকা সময়সীমা অন্তর্ভুক্ত করা ঐচ্ছিক। যদি ল্যাগড ফ্রিকোয়েন্সি অন্তর্ভুক্ত না করা হয়, অথবা যদি ল্যাগড ফ্রিকোয়েন্সি max_lag সময়কালের চেয়ে কম থাকে, তাহলে মডেলটি Adstock গণনা করে যে ফ্রিকোয়েন্সি এক্সিকিউশন প্রথম পর্যবেক্ষণ করা সময়ের আগে শূন্য। আমরা n_times + max_lag টাইম পিরিয়ডগুলি অন্তর্ভুক্ত করার পরামর্শ দিই, যদি না max_lag এর মান নিষিদ্ধভাবে বড় হয়। যদি শুধুমাত্র media ডেটা ব্যবহার করা হয়, তাহলে frequency None হবে। reach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়। |
rf_spend | একটি ঐচ্ছিক DataArray যাতে প্রতিটি নাগালের এবং ফ্রিকোয়েন্সি চ্যানেলের খরচ থাকে। এটি ROI গণনার জন্য হর হিসাবে ব্যবহৃত হয়। DataArray আকার হতে পারে (n_rf_channels,) , (n_geos, n_times, n_rf_channels) , অথবা (n_geos, n_rf_channels) । ব্যয়টি জিও এবং/অথবা সময়ের মাত্রার উপর একত্রিত হওয়া উচিত যা প্রতিনিধিত্ব করা হয় না। আমরা সুপারিশ করি যে মোট ব্যয় kpi এর টাইম উইন্ডোর সাথে সারিবদ্ধ করে এবং ডেটা controls , যেটি সময় উইন্ডো যার উপর ROI সংখ্যার ক্রমবর্ধমান প্রভাব গণনা করা হয়)। যাইহোক, নোট করুন যে ক্রমবর্ধমান প্রভাব এই টাইম উইন্ডোর আগে মিডিয়া এক্সিকিউশন দ্বারা প্রভাবিত হয়, ল্যাগড ইফেক্টের মাধ্যমে, এবং টাইম উইন্ডোর সময় এক্সিকিউট করা মিডিয়ার টাইম উইন্ডোর বাইরে ল্যাগড ইফেক্টগুলি বাদ দেয়। শুধুমাত্র media ডেটা ব্যবহার করা হলে, rf_spend None হবে না। reach , frequency এবং rf_spend একই ক্রমে একই সংখ্যক মিডিয়া চ্যানেল থাকতে হবে। যদি এই যুক্তিগুলির মধ্যে কোনটি পাস হয়, তবে অন্যগুলি ঐচ্ছিক নয়। |
control_variable | নিয়ন্ত্রণ পরিবর্তনশীল মাত্রা প্রদান করে। |
geo | জিও ডাইমেনশন প্রদান করে। |
media_channel | মিডিয়া চ্যানেলের মাত্রা প্রদান করে। |
media_spend_has_geo_dimension | media_spend অ্যারের একটি জিও মাত্রা আছে কিনা তা পরীক্ষা করে। |
media_spend_has_time_dimension | media_spend অ্যারের একটি সময় মাত্রা আছে কিনা তা পরীক্ষা করে। |
media_time | মিডিয়া সময় মাত্রা স্থানাঙ্ক প্রদান করে। |
media_time_coordinates | একটি TimeCoordinates র্যাপারে মিডিয়া সময়ের মাত্রা প্রদান করে। |
rf_channel | RF চ্যানেলের মাত্রা প্রদান করে। |
rf_spend_has_geo_dimension | rf_spend অ্যারের একটি জিও মাত্রা আছে কিনা তা পরীক্ষা করে। |
rf_spend_has_time_dimension | rf_spend অ্যারের একটি সময় মাত্রা আছে কিনা তা পরীক্ষা করে। |
time | সময় মাত্রা স্থানাঙ্ক প্রদান করে। |
time_coordinates | একটি TimeCoordinates র্যাপারে (KPI) সময়ের মাত্রা প্রদান করে। |
পদ্ধতি
as_dataset
উৎস দেখুন
as_dataset() -> xr.Dataset
একটি একক xarray.Dataset
অবজেক্ট হিসাবে ডেটা প্রদান করে।
get_all_channels
উৎস দেখুন
get_all_channels() -> np.ndarray
মিডিয়া এবং RF উভয় সহ সমস্ত চ্যানেলের মাত্রা প্রদান করে।
উৎস দেখুন
get_all_media_and_rf() -> np.ndarray
মিডিয়া এবং RF উভয় সহ মিডিয়া এক্সিকিউশনের সমস্ত মান প্রদান করে।
যদি মডেলিং এর জন্য মিডিয়া, পৌছানো এবং ফ্রিকোয়েন্সি ব্যবহার করা হয়, তাহলে পৌঁছানোর * ফ্রিকোয়েন্সি মিডিয়ার শেষ পর্যন্ত সংযুক্ত করা হয়।
রিটার্নস |
---|
np.ndarray মাত্রা সহ (n_geos, n_media_times, n_channels) প্রতিটি media_channel বা rf_channel জন্য মিডিয়া বা পৌঁছানোর * ফ্রিকোয়েন্সি ধারণকারী। |
get_n_top_largest_geos
উৎস দেখুন
get_n_top_largest_geos(
num_geos: int
) -> list[str]
জনসংখ্যা অনুসারে বৃহত্তম জিওসের নির্দিষ্ট সংখ্যা খুঁজে বের করে।
আর্গস |
---|
num_geos | জনসংখ্যার ভিত্তিতে প্রত্যাবর্তনের জন্য শীর্ষস্থানীয় বৃহত্তম জিওর সংখ্যা৷ |
রিটার্নস |
---|
শীর্ষস্থানীয় বৃহত্তম জিওগুলির নির্দিষ্ট সংখ্যার একটি তালিকা৷ |
get_total_spend
উৎস দেখুন
get_total_spend() -> np.ndarray
media_spend
এবং rf_spend
সহ মোট খরচ ফেরত দেয়।
__eq__
__eq__(
other
)
স্ব== মান ফেরত দিন।
ক্লাস ভেরিয়েবল |
---|
ফ্রিকোয়েন্সি | None |
মিডিয়া | None |
মিডিয়া_ব্যয় | None |
নাগাল | None |
আয়_প্রতি_কেপিআই | None |
rf_spend | None |