कंपैरेटिव स्टडी

सितंबर 2010 में WebP, JPEG, और JPEG 2000 का तुलनात्मक स्टडी

ध्यान दें: हमने यह शुरुआती स्टडी, WebP के पहले वर्शन पर रिलीज़ की थी, जिसमें libvpx लाइब्रेरी का इस्तेमाल किया गया था. इसके अलावा, सोर्स इमेज JPEG इमेज थीं जिन्हें हमने वेब से क्रॉल किया था. समुदाय से मिले सुझावों के आधार पर, हमने एक नई स्टडी शुरू की है. इसमें libwebp के 0.1.2 वर्शन का इस्तेमाल किया गया है. इसकी शुरुआत, सोर्स के तौर पर लॉसलेस इमेज (PNG) से की गई है. नया स्टडी इस स्टडी की जगह ले लेगी.

WebP की टीम ने इमेज को कंप्रेस करने के तीन तरीकों की तुलना करने के लिए, 10 लाख इमेज के रैंडम सेट पर स्टडी की. इस स्टडी का मकसद, इन तरीकों से हासिल किए गए कंप्रेशन को मापना और इमेज के साइज़ और कंप्रेस करने के बीच के तालमेल का विश्लेषण करना था.

डेटा सेट में शामिल 9, 00, 000 JPEG इमेज पर WebP, JPEG 2000,और Re-JPEG फ़ॉर्मैट वाली तीन कंप्रेस करने के तरीके लागू किए गए थे. JPEG इमेज को Re-JPEG फ़ॉर्मैट में फिर से कंप्रेस कर दिया जाता है, ताकि हर इमेज, सिग्नल-टू-नॉइज़ अनुपात (पीएसएनआर) के टारगेट के ज़्यादा से ज़्यादा करीब हो. टीम का विश्लेषण इन इमेज को कंप्रेस करने के बाद किया गया था.

बड़े पैमाने पर किए गए इस अध्ययन के अलावा, टीम ने मैन्युअल तौर पर 100 रैंडम इमेज की जांच की और पाया कि WebP ज़्यादातर मामलों में, अच्छी विज़ुअल क्वालिटी देता है.

मीटिंग में सामने आए नतीजे

WebP, JPEG या JPEG 2000 की तुलना में, कुल मिलाकर ज़्यादा कंप्रेशन हासिल करता है. फ़ाइल साइज़ को छोटा करने की प्रोसेस में, खास तौर पर उन छोटी इमेज की ग्रोथ ज़्यादा होती है जो वेब पर सबसे ज़्यादा देखी जाती हैं.

डेटा सेट

इस स्टडी में इस्तेमाल किया गया डेटा सेट, 10 लाख इमेज का संग्रह था, जिसे वेब से क्रॉल की गई इमेज के डेटा स्टोर करने की जगह से किसी भी क्रम में लगाया गया था. नीचे दी गई टेबल में, डेटा सेट में अलग-अलग तरह की इमेज के डिस्ट्रिब्यूशन को दिखाया गया है.

Type गिनती
JPEG ~9 लाख
PNG ~47 हज़ार
GIF ~47 हज़ार
अन्य ~6 हज़ार

एक्सपेरिमेंट का डिज़ाइन

ये प्रयोग दो चरणों में चलाए गए:

  1. टीम ने इमेज पर WebP को 42 के टारगेट PSNR के साथ चलाया. उन्होंने WebP एन्कोडर के लिए क्वालिटी पैरामीटर (QP) को तब तक ट्यून किया, जब तक कि उन्हें नतीजा नहीं मिल गया. यह नतीजा 42 के करीब-करीब उतना ही था जितना उन्हें किसी इमेज के लिए मिल सकता था. इसलिए, यह ज़रूरी नहीं है कि हर इमेज के लिए असल PSNR तय संख्या में ही हो.

  2. टीम ने WebP-कंप्रेस्ड इमेज के लिए PSNR की वैल्यू का इस्तेमाल, JPEG 2000 और Re-JPEG इमेज के लिए टारगेट PSNR के तौर पर किया है. उन्होंने JPEG 2000 और JPEG इमेज के क्वालिटी पैरामीटर पर भी एक लाइन खोज की, ताकि टारगेट PSNR के ज़्यादा से ज़्यादा करीब तक पहुंचा जा सके.

कंप्रेस करने के असल नतीजे को प्रतिशत के रूप में मापने के लिए, इस फ़ॉर्मूला का इस्तेमाल किया गया था:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

नतीजे

परीक्षणों से नकारात्मक और गैर-ऋणात्मक संपीड़न वृद्धि के ये नतीजे मिले:

गैर-ऋणात्मक कंप्रेशन गेन

अगर कंप्रेस करने के बाद इमेज का साइज़ बढ़ाया जाता है, तो टीम ने उस तरीके पर कोई कार्रवाई नहीं की. इसका मतलब है कि जब कंप्रेस की गई इमेज की लंबाई, origin_image.length से ज़्यादा होती है, तो compression_percentage को 0 माना जाता था.

नेगेटिव कंप्रेशन गेन

टीम ने अलग-अलग कंप्रेसर की परफ़ॉर्मेंस को बेहतर तरीके से समझने के लिए, नेगेटिव कंप्रेशन प्रतिशत के नतीजों की अनुमति दी.

नीचे वह औसत कंप्रेशन प्रतिशत दिया गया है, जो तीनों तरीकों में से हर एक से मिला था.

Type औसत पीएसएनआर हासिल किया गया औसत कंप्रेशन %
(नॉन-नेगेटिव कंप्रेशन गेन)
औसत कंप्रेशन %
(नेगेटिव कंप्रेशन गेन)
WebP यूरो 41.30 39.80 डॉलर
JPEG 2000 यूरो 27.67 9.71
JPEG फ़ॉर्मैट में बदलाव करें यूरो 22.37 14.62

जब कंप्रेस की गई नेगेटिव परफ़ॉर्मेंस को लागू किया गया, तब JPEG 2000 की औसत परफ़ॉर्मेंस, JPEG की तुलना में कम थी. इसकी वजह यह हो सकती है कि JPEG इमेज में ज़्यादा फ़्रीक्वेंसी वाले आर्टफ़ैक्ट मौजूद हों. इन आर्टफ़ैक्ट की वजह से, वीडियो में कंप्रेस की गई इमेज, सामान्य से कम हो सकती है.

प्रयोग में इस्तेमाल किए गए Kakadu को लागू करने के बाद, उसे JPEG 2000 में बदलने में, करीब 2,40,000 इमेज नहीं बदली जा सकीं.

JPEG 2000 का कंप्रेशन प्रतिशत री-JPEG की तुलना में कम था, क्योंकि JPEG 2000 का नतीजा कई इमेज के लिए नेगेटिव कंप्रेशन था. इस वजह से, JPEG इमेज का कुल कंप्रेशन स्कोर कम रहा.

ये आंकड़े तीन तरीकों के लिए डिस्ट्रिब्यूशन ग्राफ़ देते हैं:

इमेज 1: इमेज के साइज़ की जानकारी का बंटवारा

ग्राफ़ से पता चलता है कि ज़्यादातर इमेज छोटी थीं. आम तौर पर, 500K से ज़्यादा साइज़ वाली इमेज की फ़्रीक्वेंसी 100 से कम होती है.

इमेज 2: WebP, JPEG, और JPEG 2000 इमेज के लिए कंप्रेस करने का प्रतिशत

यह ग्राफ़ दिखाता है कि WebP से कंप्रेस की गई तस्वीरों के मुख्य हिस्से को, re-jpeg और jpeg 2000 के मुकाबले बेहतर तरीके से कंप्रेस किया गया है. साथ ही, WebP के साथ कंप्रेस की गई तस्वीरों को दूसरे तस्वीरों के मुकाबले ज़्यादा पॉज़िटिव कंप्रेस किया गया है.

तीसरी इमेज: इमेज के साइज़ और कंप्रेस करने के प्रतिशत की तुलना

इस ग्राफ़ से पता चलता है कि WebP, दूसरे फ़ॉर्मैट की तुलना में बेहतर तरीके से कंप्रेस करता है, खास तौर पर छोटी इमेज के लिए.