Nghiên cứu so sánh

Nghiên cứu so sánh về WebP, JPEG và JPEG 2000, tháng 9 năm 2010

Lưu ý: Chúng tôi đã tiến hành nghiên cứu ban đầu này với phiên bản WebP đầu tiên mà chúng tôi phát hành có sử dụng thư viện libvpx. Ngoài ra, hình ảnh nguồn là hình ảnh JPEG mà chúng tôi đã thu thập thông tin từ web. Dựa trên ý kiến phản hồi của cộng đồng, hiện chúng tôi đã thực hiện một nghiên cứu mới với phiên bản 0.1.2 của libwebp bắt đầu bằng nguồn hình ảnh không tổn hao (PNG). Nghiên cứu mới này sẽ thay thế nghiên cứu này.

Nhóm WebP đã thực hiện một nghiên cứu so sánh về 3 phương pháp nén hình ảnh trên một tập hợp 1 triệu hình ảnh ngẫu nhiên. Mục tiêu của nghiên cứu này là đo lường khả năng nén đạt được bằng các phương pháp đó và phân tích sự đánh đổi giữa kích thước hình ảnh và quá trình nén.

Ba phương thức nén là WebP, JPEG 2000 và Re-JPEG, đã được áp dụng cho 900.000 hình ảnh JPEG có trong tập dữ liệu. Hình ảnh JPEG được nén lại bằng Re-JPEG để mỗi hình ảnh đạt gần nhất có thể với giá trị tỷ lệ tín hiệu trên nhiễu tối đa (PSNR) mục tiêu. Nhóm đã phân tích các hình ảnh sau khi nén các hình ảnh đó.

Ngoài nghiên cứu trên quy mô lớn, đội ngũ này đã kiểm tra thủ công 100 hình ảnh ngẫu nhiên và nhận thấy rằng trong hầu hết trường hợp, WebP cung cấp chất lượng hình ảnh chấp nhận được.

Kết luận

WebP đạt được độ nén tổng thể cao hơn so với JPEG hoặc JPEG 2000. Việc giảm thiểu kích thước tệp đặc biệt cao đối với các hình ảnh nhỏ hơn, đây là những hình ảnh phổ biến nhất được tìm thấy trên web.

Tập dữ liệu

Tập dữ liệu sử dụng trong nghiên cứu này là tập hợp gồm 1 triệu hình ảnh được lấy mẫu ngẫu nhiên từ kho lưu trữ hình ảnh được thu thập thông tin trên web. Bảng sau đây cho thấy mức phân phối của các loại hình ảnh khác nhau trong tập dữ liệu.

Loại Số lượt
JPEG Khoảng 900 nghìn
PNG KHOẢNG 47 NGHÌN
GIF KHOẢNG 47 NGHÌN
Khác KHOẢNG 6 NGHÌN

Thiết kế thử nghiệm

Thử nghiệm được chạy theo hai giai đoạn:

  1. Nhóm này đã chạy WebP trên các hình ảnh có PSNR mục tiêu là 42. Họ đã điều chỉnh thông số chất lượng (QP) cho bộ mã hoá WebP cho đến khi đạt được kết quả gần bằng 42 điểm đối với một hình ảnh nhất định. Do đó, PSNR thực tế đạt được cho mỗi hình ảnh không nhất thiết phải là 42.

  2. Nhóm phát triển đã sử dụng giá trị PSNR cho các hình ảnh được nén bằng WebP làm PSNR mục tiêu cho các hình ảnh JPEG 2000 và Re-JPEG. Họ cũng tìm kiếm một đường theo các tham số chất lượng của hình ảnh JPEG 2000 và JPEG để càng giống với PSNR mục tiêu càng tốt.

Kết quả nén thực tế được tính dưới dạng tỷ lệ phần trăm bằng công thức sau:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

Kết quả

Các thử nghiệm mang lại kết quả sau đây cho mức tăng nén âm và không âm:

Tăng độ nén không âm

Nhóm phát triển đã không phạt một phương thức nếu phương thức đó làm tăng kích thước hình ảnh sau khi nén. Điều đó có nghĩa là

Tăng độ nén âm

Nhóm phát triển đã chấp nhận kết quả tỷ lệ phần trăm nén âm để hiểu rõ hơn về hiệu suất thô của nhiều trình nén.

Sau đây là tỷ lệ phần trăm nén trung bình mà từng phương thức đạt được.

Loại Số PSNR trung bình đạt được % Nén trung bình
(mức tăng nén không âm)
% nén trung bình
(mức tăng nén âm)
WebP 39,38 41.30 39,8
JPEG 2000 39,49 27.67 9.71
JPEG lại 39,36 22.37 14.62

Khi cho phép độ tăng nén âm, hiệu suất trung bình của JPEG 2000 thấp hơn JPEG. Điều này có thể là do các cấu phần phần mềm tần số cao có trong hình ảnh JPEG. Những cấu phần phần mềm này có thể góp phần gây ra tình trạng nén kém lý tưởng.

Việc triển khai Kakadu dùng trong thử nghiệm để chuyển đổi sang định dạng JPEG 2000 không chuyển đổi được khoảng 240.000 hình ảnh.

JPEG 2000 có tỷ lệ phần trăm nén thấp hơn so với Re-JPEG, chủ yếu là do kết quả JPEG 2000 là nén âm đối với nhiều hình ảnh. Vì lý do đó, các hình ảnh JPEG đạt được điểm nén tổng thể thấp hơn.

Các hình dưới đây cung cấp biểu đồ phân phối cho ba phương pháp:

Hình 1: Sự phân bố dân số theo kích thước hình ảnh

Biểu đồ cho thấy hầu hết hình ảnh đều có kích thước nhỏ. Tần suất của hình ảnh có kích thước lớn hơn 500K thường nhỏ hơn 100.

Hình 2: Tỷ lệ phần trăm nén cho hình ảnh WebP, JPEG và JPEG 2000

Biểu đồ này cho thấy phần nội dung của hình ảnh được nén bằng WebP có khả năng nén tốt hơn so với re-jpeg và jpeg 2000. Ngoài ra, những hình ảnh được nén bằng WebP có khả năng nén tích cực hơn so với các hình ảnh khác.

Hình 3: So sánh kích thước hình ảnh và tỷ lệ nén

Biểu đồ này cho thấy WebP có khả năng nén tốt hơn so với các định dạng khác, đặc biệt là đối với các hình ảnh nhỏ.