এই নথিটির উদ্দেশ্য হলো গুগল ট্রান্সপোর্ট প্রাইস অ্যাকুরেসি ক্রলারগুলো থেকে আসা ট্র্যাফিকের বর্ণনা দেওয়া।
কোয়েরির সংখ্যা সম্পর্কে নোট
উদাহরণস্বরূপ, যদি আমরা প্রতিদিন ৫০০০টি কোয়েরি পাঠাতে সম্মত হই, তার মানে হলো, আমাদের ক্রলারটি দিনে ৫০০০ বার (সারা দিন ধরে সমানভাবে ভাগ করে দিলে, অর্থাৎ প্রায় প্রতি ১৭ সেকেন্ডে একবার) একজন সাধারণ ব্যবহারকারীর করা নিম্নলিখিত সমস্ত কাজগুলো সম্পাদন করবে:
গুগল সার্চ থেকে শুরু করুন এবং পার্টনার লিঙ্কে ক্লিক করুন।
উদ্দিষ্ট ভ্রমণসূচী নির্বাচন করুন (যদি আগে থেকে নির্বাচিত না থাকে)।
সেই পৃষ্ঠাটিতে না পৌঁছানো পর্যন্ত 'continue'-তে ক্লিক করতে থাকুন, যেখানে ব্যবহারকারীকে ব্যক্তিগত / পেমেন্টের বিবরণ প্রবেশ করাতে হবে।
পৃষ্ঠাটি থেকে চূড়ান্ত মূল্যের বিবরণ পড়ুন।
ক্রলার সংগৃহীত রিসোর্সগুলো ফিল্টার করে।
ক্রলারটি শুধুমাত্র সেই রিসোর্সগুলোই সংগ্রহ করে যা আমাদের কাঙ্ক্ষিত তথ্য—যেমন মূল্য এবং প্রাপ্যতার বিবরণ—পেতে প্রয়োজন। বিশেষত, এর মানে হলো এটি সাধারণত শুধুমাত্র পার্টনার ওয়েবসাইট থেকেই রিসোর্স সংগ্রহ করে (অর্থাৎ আমরা কেবল একই ডোমেইনের ইউআরএলগুলোকেই অনুমোদন দিই)। এছাড়াও, সঠিক মূল্যের ডেটা পড়ার জন্য অপ্রয়োজনীয় কোনো রিসোর্স, যেমন ছবি, সংগ্রহ করা আমরা এড়িয়ে চলি।
বিশেষত, এর অর্থ হলো ক্রলারটি তৃতীয় পক্ষের (গুগল অ্যানালিটিক্স, ফেসবুক, ক্রাইটিও...) স্ক্রিপ্ট লোড ও এক্সিকিউট করে না, তাই ক্রলার ট্র্যাফিককে সেইসব অ্যানালিটিক্স থেকে বাদ দেওয়া উচিত।
ক্যাশিং
পার্টনার ওয়েবসাইটের উপর চাপ কমানোর উদ্দেশ্যে, আমাদের ক্রলারগুলোকে সাধারণত রেসপন্সে উপস্থিত সমস্ত স্ট্যান্ডার্ড http ক্যাশিং হেডার মেনে চলার জন্য কনফিগার করা থাকে। এর মানে হলো, সঠিকভাবে কনফিগার করা ওয়েবসাইটগুলোর ক্ষেত্রে আমরা এমন কন্টেন্ট বারবার ফেচ করা এড়িয়ে চলি যা খুব কমই পরিবর্তিত হয় (যেমন জাভাস্ক্রিপ্ট লাইব্রেরি)।
সমস্যা সমাধান
আমাদের ক্রলার নেটওয়ার্কের গুণমান যাচাই নির্ভর করে পার্টনার ওয়েবসাইটে অ্যাক্সেস থাকার উপর। এর জন্য প্রয়োজনীয় তথ্য এই হেল্প সেন্টার আর্টিকেলটিতে পাওয়া যাবে।