এই নির্দেশিকাটি গুগল অ্যানালিটিক্স ডেটা এপিআই (Google Analytics Data API) ব্যবহার করে তৈরি করা রিপোর্টে প্রদর্শিত ডেটা সম্পর্কিত গুরুত্বপূর্ণ তথ্য ব্যাখ্যা করে। ব্যবহারকারীরা প্রায়শই এপিআই (বিশেষত runReport মেথড) থেকে প্রাপ্ত ডেটা এবং গুগল অ্যানালিটিক্স ইউআই (UI)-তে দেখানো ডেটার মধ্যে অমিল দেখতে পান।
নমুনা সংগ্রহ এবং একত্রীকরণ
Google Analytics Data API-এর runReport মেথডটি স্যাম্পল করা ডেটা ফেরত দিতে পারে, বিশেষ করে বড় ডেটাসেট বা জটিল কোয়েরির ক্ষেত্রে। যদিও Google Analytics UI-ও স্যাম্পলিং প্রয়োগ করে, এর নির্দিষ্ট থ্রেশহোল্ড এবং অ্যালগরিদম ভিন্ন হতে পারে, যার ফলে রিপোর্ট করা মানগুলিতে সামান্য পার্থক্য দেখা যায়।
রিপোর্টের ফলাফল উপলব্ধ ডেটার একটি উপসেটের উপর ভিত্তি করে তৈরি কিনা তা বুঝতে, ResponseMetaData অবজেক্টের samplingMetadatas ফিল্ডটি পরীক্ষা করুন। যদি রিপোর্টের ফলাফল স্যাম্পল করা হয়ে থাকে, তাহলে এই ফিল্ডটি রিপোর্টে ব্যবহৃত ইভেন্টগুলোর শতাংশ বর্ণনা করে।
গুগল অ্যানালিটিক্স ডেটা এপিআই-এর কিছু রিপোর্টিং পদ্ধতিতে আপনি আপনার পছন্দসই স্যাম্পলিং লেভেল নির্দিষ্ট করে দিতে পারেন। রিপোর্টের স্যাম্পলিং লেভেল নিয়ন্ত্রণ করতে আপনি properties.reportTasks.create মেথডের samplingLevel ফিল্ডটি ব্যবহার করতে পারেন।
এই ফিচারটি গুগল অ্যানালিটিক্স ৩৬০ প্রপার্টিগুলোকে ১ বিলিয়ন ইভেন্টের উচ্চতর স্যাম্পলিং লিমিট ব্যবহারের সুযোগ দেয়। এছাড়াও, বিপুল সংখ্যক ইভেন্টের ক্ষেত্রে আনস্যাম্পলড ফলাফল ব্যবহার করার জন্য স্যাম্পলিং লিমিটকে UNSAMPLED এ সেট করা যেতে পারে।
আরও তথ্যের জন্য, ডেটা স্যাম্পলিং সম্পর্কে দেখুন।
অনন্য গণনার আনুমানিক হিসাব
গুগল অ্যানালিটিক্স ডেটা এপিআই, অ্যাক্টিভ ইউজার এবং সেশনের মতো মেট্রিকগুলোর জন্য ইউনিক কাউন্ট অনুমান করতে হাইপারলগলগ++ (HLL++) অ্যালগরিদম ব্যবহার করে। এপিআই এবং গুগল অ্যানালিটিক্স ইউআই-তে পারফরম্যান্স উন্নত করতে এবং বৃহৎ ডেটাসেট দক্ষতার সাথে পরিচালনা করার জন্য এই পদ্ধতিটি ব্যবহার করা হয়, যার ফলে ফলাফলগুলো সঠিক সংখ্যার পরিবর্তে একটি আনুমানিক হিসাব দেয়।
অতিরিক্ত তথ্যের জন্য, নিম্নলিখিত উৎসগুলো দেখুন: গুগল অ্যানালিটিক্সে অনন্য সংখ্যার আনুমানিক হিসাব এবং ব্যবহারকারীর সংখ্যায় পার্থক্য ।
ডেটা থ্রেশহোল্ডিং
গুগল অ্যানালিটিক্স ডেটাতে উপস্থিত জনসংখ্যাগত তথ্য, আগ্রহ বা অন্যান্য সংকেতের ভিত্তিতে স্বতন্ত্র ব্যবহারকারীদের শনাক্তকরণ রোধ করতে রিপোর্টে ডেটা থ্রেশহোল্ডিং প্রয়োগ করতে পারে।
রিপোর্টের কোনো সারিতে ব্যবহারকারীর সংখ্যা কম থাকলে, সেই সারিটি ফলাফল থেকে বাদ দেওয়া হতে পারে। যেসব রিপোর্টে হাই-কার্ডিনালিটি ডাইমেনশন বা কাস্টম ডাইমেনশন অন্তর্ভুক্ত থাকে, সেগুলোর ক্ষেত্রে এমনটা বেশি দেখা যায়।
এই প্রতিবেদনটি থ্রেশহোল্ডিংয়ের আওতাধীন কিনা তা বুঝতে, ResponseMetaData অবজেক্টের subjectToThresholding ফিল্ডটি পরীক্ষা করুন।
আরও তথ্যের জন্য, ডেটা থ্রেশহোল্ড দেখুন।
(other) সারি
যদি কোনো ডাইমেনশনের কার্ডিনালিটি বেশি হয়, তাহলে গুগল অ্যানালিটিক্স কম ব্যবহৃত মানগুলোকে (other) লেবেলযুক্ত একটি সারিতে একত্রিত করতে পারে। এটি সেইসব রিপোর্টে বেশি দেখা যায়, যেগুলোতে প্রতিদিন ৫০০-এর বেশি অনন্য মানসহ ডাইমেনশন অন্তর্ভুক্ত থাকে।
ডেটা এপিআই (Data API)-এর সাথে ফিল্টার ব্যবহার করার সময় মনে রাখবেন যে, ফিল্টারগুলি (other) সারির ভিতরে দেখে না, এবং ডেটা একত্রিত হওয়ার ও (other) সারিটি তৈরি হওয়ার পরেই সেগুলি প্রয়োগ করা হয়।
কোনো রিপোর্টে (other) সারিতে ডেটা অন্তর্ভুক্ত আছে কিনা তা বুঝতে, ResponseMetaData অবজেক্টের dataLossFromOtherRow ফিল্ডটি পরীক্ষা করুন।
আরও তথ্যের জন্য, গুগল অ্যানালিটিক্স ৪-এর (অন্যান্য) সারিটি দেখুন।
পরিচয় প্রতিবেদন
রিপোর্টিং আইডেন্টিটি নির্ধারণ করে যে রিপোর্টে ব্যবহারকারীদের ডুপ্লিকেট কীভাবে বাদ দেওয়া হবে। বিভিন্ন আইডেন্টিটি সেটিংস (যেমন "ব্লেন্ডেড" বা "ডিভাইস-ভিত্তিক") একই তারিখের পরিসরের জন্য ব্যবহারকারীর সংখ্যায় ভিন্নতা আনতে পারে।
Google Analytics UI এবং ডেটা API উভয়ই আপনার প্রপার্টির জন্য একই রিপোর্টিং আইডেন্টিটি সেটিং ব্যবহার করে। এই সেটিং পরিবর্তন করা হলে, তা UI এবং API উভয়ের রিপোর্টকেই প্রভাবিত করবে। UI-তে রিপোর্ট চালানো এবং API-এর মাধ্যমে রিপোর্টের ডেটা সংগ্রহের মধ্যবর্তী সময়ে যদি সেটিংটি পরিবর্তন করা হয়, তাহলে একই তারিখের পরিসরের জন্য দুটি রিপোর্টের ব্যবহারকারীর সংখ্যা ভিন্ন হতে পারে।
কোয়েরি স্পেসিফিসিটি
অমিল কমাতে, নিশ্চিত করুন যে আপনার API অনুরোধের নিম্নলিখিত প্যারামিটারগুলি Google Analytics UI রিপোর্টের সেটিংসের সাথে হুবহু মিলে যায়:
- তারিখের পরিসর : শুরু এবং শেষের তারিখ একই কিনা তা যাচাই করুন।
- ডাইমেনশন ও মেট্রিক্স : নিশ্চিত করুন যে আপনার API অনুরোধের ডাইমেনশন ও মেট্রিক্স, Google Analytics UI রিপোর্টের ডাইমেনশন ও মেট্রিক্সের সাথে একই।
- ফিল্টার : নিশ্চিত করুন যে API অনুরোধে প্রয়োগ করা যেকোনো ডাইমেনশন বা মেট্রিক ফিল্টার UI-তে ব্যবহৃত ফিল্টারগুলোর সাথে মেলে।
একটি রিপোর্টে ডাইমেনশন যোগ করলে গণনার জন্য ব্যবহৃত ইভেন্টের সংখ্যা কমে যেতে পারে। শুধুমাত্র সেইসব ইভেন্টই রিপোর্টে অন্তর্ভুক্ত করা হয়, যেগুলোতে অনুরোধ করা ডাইমেনশনগুলোর ডেটা থাকে। ফলে, একটি কোয়েরিতে ডাইমেনশন যোগ করলে রিপোর্টের মেট্রিকগুলোর অ্যাগ্রিগেটেড মান পরিবর্তিত হতে পারে।
ডেটার সতেজতা
গুগল অ্যানালিটিক্স ইভেন্ট ডেটা প্রসেস এবং একত্রিত করতে সময় নেয়। খুব সাম্প্রতিক ডেটা নিয়ে কাজ করার সময়, ডেটা সংগ্রহের মধ্যে সময়ের ব্যবধান থাকলে রিপোর্টগুলোর মধ্যে সামান্য পার্থক্য দেখা যেতে পারে। উদাহরণস্বরূপ, আপনি যদি UI-তে একটি রিপোর্ট দেখেন এবং কয়েক মিনিট পরে একই রিপোর্টের জন্য API-তে কোয়েরি করেন, তাহলে চলমান প্রসেসিং এবং একত্রীকরণের কারণে ডেটা পরিবর্তিত হয়ে যেতে পারে।
আরও তথ্যের জন্য, ডেটা ফ্রেশনেস দেখুন।
নমুনাবিহীন ডেটা বিকল্প
যদি আপনার ব্যবহারের ক্ষেত্রে সম্পূর্ণ, নমুনাবিহীন, ইভেন্ট-স্তরের ডেটার প্রয়োজন হয়, তাহলে নিম্নলিখিত বিকল্পগুলি ব্যবহার করার কথা বিবেচনা করুন:
BigQuery এক্সপোর্ট : গুগল অ্যানালিটিক্সের জন্য BigQuery এক্সপোর্ট
কাঁচা ইভেন্ট ডেটার উন্নত বিশ্লেষণের জন্য এটিই প্রস্তাবিত পদ্ধতি।
অ্যানালিটিক্স ৩৬০ : যেসব প্রপার্টির অ্যানালিটিক্স ৩৬০ লাইসেন্স রয়েছে, সেগুলোতে স্যাম্পলিংয়ের সীমা বেশি থাকে এবং আরও বিস্তারিত রিপোর্টিং ফিচার ব্যবহারের সুযোগ পাওয়া যায়।