आपकी इन्वेंट्री के आधार पर, फ़ीड को कई फ़ाइलों में बांटना यानी कि 'शर्डिंग' करना ज़रूरी हो सकता है.
sharding का इस्तेमाल कब करना चाहिए
gzip कंप्रेस करने के बाद, फ़ीड का साइज़ 1 फ़ाइल के लिए 200 एमबी से ज़्यादा हो गया है.
- उदाहरण: उपलब्धता का जनरेट किया गया फ़ीड 1 जीबी का है. इसे 5 से ज़्यादा अलग-अलग फ़ाइलों (या शर्ड) में बांटा जाना चाहिए.
पार्टनर इन्वेंट्री को अलग-अलग सिस्टम और/या इलाकों में बांटा जाता है. इससे इन्वेंट्री को मिलान करने में समस्या आती है.
- उदाहरण: पार्टनर के पास अमेरिका और ईयू की इन्वेंट्री है, जो अलग-अलग
सिस्टम में मौजूद है. फ़ीड को दो फ़ाइलों (या शर्ड) से जनरेट किया जा सकता है. एक अमेरिका के लिए और एक यूरोपीय संघ के लिए. दोनों फ़ाइलों में एक ही
nonceऔरgeneration_timestampहोना चाहिए.
- उदाहरण: पार्टनर के पास अमेरिका और ईयू की इन्वेंट्री है, जो अलग-अलग
सिस्टम में मौजूद है. फ़ीड को दो फ़ाइलों (या शर्ड) से जनरेट किया जा सकता है. एक अमेरिका के लिए और एक यूरोपीय संघ के लिए. दोनों फ़ाइलों में एक ही
सामान्य नियम
- gzip कंप्रेस करने के बाद, हर फ़ाइल का साइज़ 200 एमबी से ज़्यादा नहीं होना चाहिए.
- हमारा सुझाव है कि हर फ़ीड के लिए 20 से ज़्यादा शार्ड न बनाएं. अगर आपके कारोबार के लिए, इस रकम से ज़्यादा की ज़रूरत है, तो ज़्यादा जानकारी के लिए कृपया सहायता टीम से संपर्क करें.
-
अलग-अलग रिकॉर्ड (उदाहरण के लिए, एक
Merchantऑब्जेक्ट) को एक ही शर्ड में भेजा जाना चाहिए. उन्हें कई शर्ड में नहीं बांटा जा सकता. हालांकि, आने वाले समय में फ़ीड के लिए, इन्हें एक हीshard_numberवाले स्HARD में भेजने की ज़रूरत नहीं है. - बेहतर परफ़ॉर्मेंस के लिए, आपका डेटा सभी स्hards में बराबर-बराबर बांटा जाना चाहिए, ताकि सभी स्hard की फ़ाइलों का साइज़ एक जैसा हो.
फ़ीड को अलग-अलग हिस्सों में बांटने का तरीका
इवेंट फ़ीड को अलग-अलग हिस्सों में बांटा जा सकता है. इसके लिए, एक JSON फ़ाइल को अलग-अलग JSON फ़ाइलों में बांटें. इन फ़ाइलों में ऐसे इवेंट होने चाहिए जो एक-दूसरे से ओवरलैप न हों. साथ ही, फ़ाइल डिस्क्रिप्टर JSON को JSON फ़ाइल के नामों की सूची के साथ अपडेट करें.
सुझाव: हर फ़ाइल (या शर्ड) के लिए, फ़ाइल का नाम सेट करें, ताकि फ़ीड टाइप, टाइमस्टैंप, और शर्ड नंबर का पता चल सके. सभी स्hards का साइज़ एक जैसा होना चाहिए. सभी स्hards अपलोड होने के बाद, उन्हें प्रोसेस किया जाता है.
शर्ड किए गए डेटा का उदाहरण
फ़ाइल की जानकारी - event.feeddata.v1_1728306001.filedescriptor.json
{
"generation_timestamp": 1728306001,
"name": "event.feeddata.v1",
"data_file": [
"event.feeddata.v1_1728306001_001.json",
"event.feeddata.v1_1728306001_002.json"
]
}शर्ड 0 - event.feeddata.v1_1728306001_001.json
{
"data": [
{
"id": "event-1",
...
},
{
"id": "event-2",
...
}
]
}पहला स्hard - event.feeddata.v1_1728306001_002.json
{
"data": [
{
"id": "event-3",
...
},
{
"id": "event-4",
...
}
]
}पार्टनर की डिस्ट्रिब्यूट की गई इन्वेंट्री के लिए स्HARD
कई सिस्टम और/या इलाकों में डिस्ट्रिब्यूट की गई इन्वेंट्री को एक फ़ीड में इकट्ठा करना, पार्टनर के लिए मुश्किल हो सकता है. हर एक स्HARD को डिस्ट्रिब्यूट किए गए सिस्टम के इन्वेंट्री सेट से मैच करने के लिए सेट करके, हर एक स्HARD को अलग-अलग हिस्सों में बांटने की सुविधा का इस्तेमाल, मिलान से जुड़ी समस्याओं को हल करने के लिए किया जा सकता है.
उदाहरण के लिए, मान लें कि किसी पार्टनर की इन्वेंट्री को दो क्षेत्रों (अमेरिका और ईयू इन्वेंट्री) में बांटा गया है, जो दो अलग-अलग सिस्टम में मौजूद हैं.
पार्टनर, हर फ़ीड को दो फ़ाइलों (या शर्ड) में बांट सकता है:
फ़ीड सही तरीके से प्रोसेस हो रहे हैं, यह पक्का करने के लिए यह तरीका अपनाएं:
- अपलोड का शेड्यूल तय करें और इन्वेंट्री के हर इंस्टेंस को शेड्यूल के हिसाब से कॉन्फ़िगर करें.
- हर इंस्टेंस के लिए यूनीक शार्ड नंबर असाइन करें. उदाहरण के लिए, अमेरिका = N, यूरोपीय संघ = N + 1.
total_shardsको शर्ड की कुल संख्या पर सेट करें. - अपलोड के लिए शेड्यूल किए गए हर समय पर, एक
generation_timestampचुनें. इन दोनों फ़ील्ड के लिए, सभी फ़ाइल नामों की वैल्यू एक जैसी होनी चाहिए. साथ ही, डिस्क्रिप्टर फ़ाइल में सभी फ़ाइल नामों की सूची होनी चाहिए.generation_timestampकी तारीख मौजूदा या हाल ही की होनी चाहिए (आदर्श रूप से, पार्टनर के डेटाबेस में पढ़े जाने के समय का टाइमस्टैंप)
- सभी शर्ड अपलोड होने के बाद, Google
generation_timestampऔरnonceका इस्तेमाल करके शर्ड को ग्रुप में बांटता है.
Google, फ़ीड को एक फ़ीड के तौर पर प्रोसेस करेगा. भले ही, हर शर्ड, पार्टनर की इन्वेंट्री के किसी अलग इलाके को दिखाता हो और उसे दिन के अलग-अलग समय पर अपलोड किया जा सकता हो. हालांकि, ऐसा तब ही होगा, जब सभी शर्ड में generation_timestamp एक जैसा हो.