Estudo comparativo do WebP, JPEG e JPEG 2000, setembro de 2010
Observação: conduzimos esse estudo inicial com a primeira versão do WebP que lançamos, que usou a biblioteca libvpx
. Além disso, as imagens
de origem eram imagens JPEG que rastreamos da Web. Com base no feedback da
comunidade, agora realizamos um
novo estudo com a versão 0.1.2 do libwebp
,
começando com imagens sem perda (PNG) como fonte. O novo estudo substitui este
estudo.
A equipe do WebP realizou um estudo comparativo sobre três métodos de compactação de imagens em um conjunto aleatório de um milhão de imagens. Os objetivos do estudo eram medir a compactação realizada por esses métodos e analisar as compensações entre tamanhos e compactação de imagens.
Três métodos de compactação, WebP, JPEG 2000 e Re-JPEG, foram aplicados às 900.000 imagens JPEG contidas no conjunto de dados. As imagens JPEG foram recompactadas com o recurso Re-JPEG, de modo que cada uma delas fique o mais próxima possível do valor de pico de proporção de sinal para ruído (PSNR, na sigla em inglês). A análise da equipe foi feita nas imagens após a compactação.
Além do estudo em grande escala, a equipe inspecionou manualmente 100 imagens aleatórias e descobriu que, na maioria dos casos, a WebP oferece qualidade visual aceitável.
Conclusões
O WebP atinge uma compactação geral maior do que o JPEG ou o JPEG 2000. Os ganhos na minimização do tamanho do arquivo são particularmente altos para imagens menores, que são as mais comuns encontradas na Web.
Conjunto de dados
O conjunto de dados usado no estudo foi uma coleção de um milhão de imagens coletadas aleatoriamente de um repositório de imagens rastreadas na Web. A tabela a seguir mostra a distribuição de diferentes tipos de imagens no conjunto de dados.
Tipo | Contar |
---|---|
JPEG | Aprox. 900 mil |
PNG | Cerca de 47 mil |
GIF | Cerca de 47 mil |
Outro | Aprox. 6K |
Design do experimento
Os experimentos foram realizados em duas etapas:
A equipe executou o WebP nas imagens com um PSNR de destino de 42. Eles ajustaram o parâmetro de qualidade (QP) do codificador WebP até alcançarem um resultado próximo de 42 para uma determinada imagem. A PSNR real recebida para cada imagem, portanto, não foi necessariamente 42.
A equipe usou o valor PSNR nas imagens compactadas como WebP como o PSNR de destino das imagens JPEG 2000 e Re-JPEG. Eles também executaram uma pesquisa de linha sobre os parâmetros de qualidade das imagens JPEG 2000 e JPEG para se aproximar o máximo possível da PSNR de destino.
O resultado real da compactação foi medido como uma porcentagem usando a seguinte fórmula:
compression_percentage = 100 * (original_image.length - compressed_image.length) / original_image.length
Resultados
Os testes geraram os seguintes resultados para ganhos de compactação negativos e não negativos:
Ganho de compactação não negativo
A equipe não penaliza um método quando ele aumenta o tamanho da imagem após a compactação. Ou seja, a compactação_compactage é considerada 0 quando o valor de compacto_image.length é maior que o do atributo original_image.length.
Ganho de compactação negativa
A equipe permitiu que os resultados da porcentagem de compactação negativa pudessem entender melhor os vários compressores, o desempenho bruto.
Veja a seguir as porcentagens médias de compactação que foram alcançadas por cada um dos três métodos.
Tipo | PSNR médio obtido | % de compactação média (ganho de compactação não negativa) |
% média de compressão (ganho de compactação negativa) |
---|---|---|---|
WebP | 39,38 | 41,30 | 39,80 |
JPEG 2.000 | 39,49 | 27,67 | 9,71 |
Reiniciar | 39,36 | 22,37 | 14,62 |
Quando o ganho de compactação negativo era permitido, o desempenho médio para JPEG 2000 foi menor que o do JPEG. Isso pode ocorrer devido a artefatos de alta frequência presentes nas imagens JPEG. Esses artefatos podem contribuir para uma situação de compactação inferior ao ideal.
A implementação do Kakadu usada no experimento para converter para JPEG 2000 não conseguiu converter aproximadamente 240.000 imagens.
O formato JPEG 2000 teve porcentagens de compactação mais baixas do que a nova publicação, principalmente porque o resultado do formato JPEG 2000 foi uma compactação negativa para muitas imagens. Por isso, as imagens JPEG alcançaram uma pontuação de compactação geral mais baixa.
As figuras a seguir fornecem gráficos de distribuição para os três métodos:
Figura 1: distribuição da população do tamanho da imagem
O gráfico mostra que a maioria das imagens eram pequenas. A frequência das imagens com tamanho maior que 500 mil geralmente é menor que 100.
Figura 2: porcentagens de compactação para imagens WebP, JPEG e JPEG 2000
Este gráfico demonstra que o corpo de imagens compactados com WebP tem uma compactação melhor do que o rejpeg e o jpeg 2000. Além disso, as imagens compactadas com WebP têm uma compactação mais positiva do que as outras.
Figura 3: comparação de tamanhos de imagem e porcentagem de compactação
Este gráfico mostra que o WebP oferece melhor compactação do que os outros formatos, especialmente para imagens menores.