Estudo comparativo

Estudo comparativo do WebP, JPEG e JPEG 2000, setembro de 2010

Observação: conduzimos esse estudo inicial com a primeira versão do WebP que lançamos, que usou a biblioteca libvpx. Além disso, as imagens de origem eram imagens JPEG que rastreamos da Web. Com base no feedback da comunidade, agora realizamos um novo estudo com a versão 0.1.2 do libwebp, começando com imagens sem perda (PNG) como fonte. O novo estudo substitui este estudo.

A equipe do WebP realizou um estudo comparativo sobre três métodos de compactação de imagens em um conjunto aleatório de um milhão de imagens. Os objetivos do estudo eram medir a compactação realizada por esses métodos e analisar as compensações entre tamanhos e compactação de imagens.

Três métodos de compactação, WebP, JPEG 2000 e Re-JPEG, foram aplicados às 900.000 imagens JPEG contidas no conjunto de dados. As imagens JPEG foram recompactadas com o recurso Re-JPEG, de modo que cada uma delas fique o mais próxima possível do valor de pico de proporção de sinal para ruído (PSNR, na sigla em inglês). A análise da equipe foi feita nas imagens após a compactação.

Além do estudo em grande escala, a equipe inspecionou manualmente 100 imagens aleatórias e descobriu que, na maioria dos casos, a WebP oferece qualidade visual aceitável.

Conclusões

O WebP atinge uma compactação geral maior do que o JPEG ou o JPEG 2000. Os ganhos na minimização do tamanho do arquivo são particularmente altos para imagens menores, que são as mais comuns encontradas na Web.

Conjunto de dados

O conjunto de dados usado no estudo foi uma coleção de um milhão de imagens coletadas aleatoriamente de um repositório de imagens rastreadas na Web. A tabela a seguir mostra a distribuição de diferentes tipos de imagens no conjunto de dados.

Tipo Contar
JPEG Aprox. 900 mil
PNG Cerca de 47 mil
GIF Cerca de 47 mil
Outro Aprox. 6K

Design do experimento

Os experimentos foram realizados em duas etapas:

  1. A equipe executou o WebP nas imagens com um PSNR de destino de 42. Eles ajustaram o parâmetro de qualidade (QP) do codificador WebP até alcançarem um resultado próximo de 42 para uma determinada imagem. A PSNR real recebida para cada imagem, portanto, não foi necessariamente 42.

  2. A equipe usou o valor PSNR nas imagens compactadas como WebP como o PSNR de destino das imagens JPEG 2000 e Re-JPEG. Eles também executaram uma pesquisa de linha sobre os parâmetros de qualidade das imagens JPEG 2000 e JPEG para se aproximar o máximo possível da PSNR de destino.

O resultado real da compactação foi medido como uma porcentagem usando a seguinte fórmula:

compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length

Resultados

Os testes geraram os seguintes resultados para ganhos de compactação negativos e não negativos:

Ganho de compactação não negativo

A equipe não penaliza um método quando ele aumenta o tamanho da imagem após a compactação. Ou seja, a compactação_compactage é considerada 0 quando o valor de compacto_image.length é maior que o do atributo original_image.length.

Ganho de compactação negativa

A equipe permitiu que os resultados da porcentagem de compactação negativa pudessem entender melhor os vários compressores, o desempenho bruto.

Veja a seguir as porcentagens médias de compactação que foram alcançadas por cada um dos três métodos.

Tipo PSNR médio obtido % de compactação média
(ganho de compactação não negativa)
% média de compressão
(ganho de compactação negativa)
WebP 39,38 41,30 39,80
JPEG 2.000 39,49 27,67 9,71
Reiniciar 39,36 22,37 14,62

Quando o ganho de compactação negativo era permitido, o desempenho médio para JPEG 2000 foi menor que o do JPEG. Isso pode ocorrer devido a artefatos de alta frequência presentes nas imagens JPEG. Esses artefatos podem contribuir para uma situação de compactação inferior ao ideal.

A implementação do Kakadu usada no experimento para converter para JPEG 2000 não conseguiu converter aproximadamente 240.000 imagens.

O formato JPEG 2000 teve porcentagens de compactação mais baixas do que a nova publicação, principalmente porque o resultado do formato JPEG 2000 foi uma compactação negativa para muitas imagens. Por isso, as imagens JPEG alcançaram uma pontuação de compactação geral mais baixa.

As figuras a seguir fornecem gráficos de distribuição para os três métodos:

Figura 1: distribuição da população do tamanho da imagem

O gráfico mostra que a maioria das imagens eram pequenas. A frequência das imagens com tamanho maior que 500 mil geralmente é menor que 100.

Figura 2: porcentagens de compactação para imagens WebP, JPEG e JPEG 2000

Este gráfico demonstra que o corpo de imagens compactados com WebP tem uma compactação melhor do que o rejpeg e o jpeg 2000. Além disso, as imagens compactadas com WebP têm uma compactação mais positiva do que as outras.

Figura 3: comparação de tamanhos de imagem e porcentagem de compactação

Este gráfico mostra que o WebP oferece melhor compactação do que os outros formatos, especialmente para imagens menores.