Volume audio

LUFS (Loudness Unit relative a Full Scale) è uno standard che consente la normalizzazione del volume in molti generi e stili di produzione. LUFS è un algoritmo complesso basato sul volume percepito dell'udito umano a un volume di ascolto confortevole e consente ai produttori di audio di evitare salti di ampiezza che potrebbero richiedere agli utenti di regolare costantemente il volume. LUFS è anche noto come LKFS (Loudness, ponderato K, relativo a Full Scale)

Durante la riproduzione di file audio utilizzando SSML, il volume medio dovrebbe essere pari a -16 LUFS (Loudness Unit Full Scale) per i contenuti audio stereo, che corrispondono al volume medio dell'output di sintesi vocale dell'Assistente Google. Questo livello offre un buon equilibrio tra il controllo del volume complessivo sull'altoparlante ad attivazione vocale e un ampio margine di manovra per materiale con gamma dinamica variabile rispetto all'Assistente Google.

Per i contenuti audio mono, il volume medio deve essere -19 LUFS, anziché -16 LUFS. Il target di volume per i contenuti audio in formato mono è diverso da quello dei contenuti audio stereo perché, quando il contenuto audio in formato mono viene convertito in stereo, duplicando la traccia audio mono su entrambi i canali di un segnale stereo, l'energia del segnale raddoppia, il che corrisponde a un aumento della misurazione LUFS di 3,01 Loudness Unit (LU). Al contrario, quando un segnale stereo viene convertito in mono per la riproduzione su un singolo altoparlante, il segnale mono è in genere realizzato mediando il segnale proveniente da ciascun canale e questa trasformazione riduce la misurazione della LUFS esattamente della stessa quantità, ovvero 3, 01 LU. Di conseguenza, le misurazioni del volume per i contenuti in formato mono e stereo non sono direttamente comparabili, ma devono essere compensate da 3.01 LUFS.

Alcuni misuratori del volume offrono opzioni per correggere questa disparità; ad esempio, se utilizzi l'opzione ffmpeg (vedi sotto), puoi utilizzare l'opzione dual_mono (o dualmono), come consigliato di seguito. Se utilizzi un misuratore del volume con questa opzione e hai abilitato questa opzione, il target del volume deve essere -16 LUFS, a prescindere dal fatto che il contenuto sia stereo o mono.

Consigliamo due opzioni per misurare e regolare il volume audio:

Utilizzo di uno strumento di misurazione DAW e LUFS

I passaggi seguenti spiegano come garantire che l'audio soddisfi il consiglio -16 LUFS:

  1. Crea tutto l'audio a livelli costantemente sono alti e bilanciati (equamente) per l'intera durata, in modo che non ci siano picchi o cali di volume.
  2. Configura una workstation audio digitale (DAW) e uno strumento LUFS per misurare il volume dell'audio rispetto a Google TTS Loudness Reference.
  3. Misura e regola il volume dell'audio in modo da avere un volume medio integrato di circa -16 LUFS (o -19 LUFS se il contenuto è mono).
  4. Controlla l'audio dell'audio confrontando il volume con quello di Google TTS Loudness Reference.

Configura uno strumento di misurazione DAW e LUFS

Esistono molti strumenti di misurazione DAW e LUFS disponibili come prodotti freeware e commerciali. Se hai già uno strumento di misurazione DAW e LUFS preferito, puoi utilizzarlo. Altrimenti, consigliamo Audacity per Windows e Linux o Reaper per Mac per DAW e TBProAudio dpMeter II per uno strumento di misurazione LUFS. Le seguenti sezioni presuppongono che tu stia utilizzando questi strumenti.

Recupera i file

  1. Scarica e installa una DAW:
  2. Scarica e installa dpMeter II per il tuo sistema operativo. Questo strumento funziona sia con Audacity che con Reaper come plug-in VST (Virtual Studio Technology).
  3. Scarica il file audio Google TTS Loudness Reference. L'audio di sintesi vocale recita: "Il volume integrato di questa frase è di circa -16 LUFS". Questo file funge da audio di prova per il misuratore e da riferimento per il controllo uditivo.

Configurazione di dpMeter II per Audacity (Windows/Linux)

  1. Apri il file audio di Google TTS Loudness Reference in Audacity.
  2. Apri il plug-in dpMeter II facendo clic sulla scheda Effetto e scegliendo Aggiungi/Rimuovi plug-in.
  3. Individua dpMeter2 nell'elenco, fai clic su Abilita, quindi OK. Il plug-in dpMeter II viene ora visualizzato nel menu a discesa Effetto.
  4. Fai clic su dpMeter2 dal menu a discesa Effetto per aprire il plug-in. dpMeter II viene impostato in modo predefinito sulla modalità RMS (combinazione di colori arancione). Cambia la modalità in EBU r128 (combinazione di colori blu) per misurare LUFS.

Configurare dpMeter II per Reaper (Mac)

  1. Apri l'audio di Google TTS Loudness Reference facendo clic su Inserisci > File multimediale....
  2. Apri il plug-in dpMeter II facendo clic sul pulsante verde FX (numero 1 nella figura) nel riquadro a sinistra del livello audio. Viene visualizzata una finestra FX.

  3. Fai clic su dpMeter2 nell'elenco. dpMeter II utilizza per impostazione predefinita la modalità RMS (schema di colore arancione). Cambia la modalità in EBU r128 (schema di colori blu) per misurare LUFS.

Misurazione e regolazione del volume

Metri diversi in DAW differenti forniscono letture leggermente diverse. Audacity tende a misurare il valore di riferimento del rumore di Google TTS un po' più forte di altri DAW, a -15,1 LUFS, mentre Reaper dà una lettura di -16,0 LUFS. Se la tua DAW misura il volume di Google TTS Loudness Reference con una variazione di +/-2 LUFS di -16, dovrebbe andar bene per impostare il volume dell'audio.

I passaggi di base per misurare e regolare il volume sono:

  1. Utilizza dpMeter II per misurare il volume di Google TTS Loudness Reference per stabilire una lettura LUFS di base. Se la tua DAW misura superiore o inferiore a -16 LUFS per Google TTS Loudness Reference, abbina l'audio alla base della DAW. Ad esempio, in Audacity, dpMeter II misura un volume integrato di -15,1 LUFS, quindi il nuovo volume target per il programma dovrebbe essere -15,1 LUFS.
  2. Dopo aver stabilito una base di riferimento, regola l'audio in modo che corrisponda alla lettura di riferimento.

Misurazione del riferimento di volume di sintesi vocale di Google

Fai clic sul pulsante di riproduzione verde in dpMeter II o premi il pulsante di riproduzione (barra spaziatrice) nella DAW (numero 4 di seguito) per misurare il volume del file.

Il seguente elenco descrive le principali funzionalità che potresti utilizzare in dpMeter II:

  1. Modalità: imposta su EBU (anziché RMS) per misurare il volume in LUFS
  2. Controllo guadagno: assicurati che sia impostato su 0.0 fino a quando non sei pronto a modificare il volume del programma.
  3. Loudness integrato: misura il volume medio di tutto l'audio che il plug-in ha analizzato dopo che è stato fatto clic sul pulsante di reset (5). Fai clic sul pulsante di ripristino (5) prima di ogni misurazione del volume per assicurarti di misurare solo il volume della selezione corrente.
  4. Riproduci: avvia l'analisi del volume del file audio. (questo pulsante non viene visualizzato in tutte le DAW, Fai clic sul pulsante di riproduzione principale (barra spaziatrice) nella DAW per ottenere lo stesso effetto.
  5. Reimposta: fai clic su questo pulsante tra una misurazione del volume e l'altra.
  6. Apply (Applica): quando sei pronto a modificare il volume del materiale del programma affinché corrisponda al Loudness Reference di Google, questo pulsante applica la variazione di volume impostata dal controllo guadagno (2).

Abbinamento del volume al riferimento Loudness di Google TTS

Ora che hai misurato il volume di Google TTS Loudness Reference, puoi misurarlo e regolarlo:

  1. Apri il file audio e fai clic su scegli dpMeter2 dal menu Effetti.
  2. Fai clic sul pulsante Riproduci e lascia che il valore del volume integrato si stabilizzi su un valore medio per il tuo file audio.
  3. Se il volume integrato è diverso da quello di Google TTS Loudness Reference, regola il guadagno dell'audio in modo che corrisponda a quello del riferimento. Ad esempio, se l'audio misura a un volume integrato di -12, il volume è troppo alto, quindi riduci il guadagno impostando Controllo guadagno su -4 db e facendo clic su Applica per portarlo nell'intervallo di destinazione del riferimento di volume di Google TTS (-16 LUFS). Potrebbe essere necessario misurare e regolare il guadagno per raggiungere il volume target, perché il guadagno approssima solo il valore LUFS.

Utilizzo di ffmpeg

FFmpeg è un framework multimediale con uno strumento a riga di comando per la conversione di contenuti multimediali. Lo strumento include un filtro chiamato loudnorm per la normalizzazione del volume. Puoi utilizzare largenorm per emettere una versione del file audio al volume LUFS appropriato, pari a -16 LUFS, utilizzando la modalità dual-pass.

  1. Scarica e installa FFmpeg.
  2. Vai alla directory di installazione ed esegui FFmpeg con il filtro volume norm nel file di input. Assicurati di attivare l'opzione dual_mono.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    Questo indica a FFmpeg di misurare i valori audio del file multimediale senza creare un file di output. Otterrai una serie di valori presentati come segue:

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    I valori di esempio riportati sopra indicano informazioni importanti sui media in entrata. Ad esempio, il valore Input Integrated mostrato indica un audio troppo forte. Il valore Output Integrated è molto più vicino a -16,0. I valori di Input True Peak e Input LRA, o di volume, sono superiori ai valori massimi forniti e verranno ridotti nella versione normalizzata. Infine, Target Offset rappresenta il guadagno di offset utilizzato nell'output.

  3. Esegui un secondo passaggio del filtro volumenorm, fornendo i valori del passaggio 1 come valori "misurati" nelle opzioni volumenorm.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    Viene creato un file output.wav contenente una versione normalizzata del volume del file di input.

Ascolta i seguenti esempi di file audio prima e dopo la normalizzazione del volume ffmpeg per conoscere il funzionamento dello strumento.

Prima

Dopo

Controlla l'audio

Esegui un controllo dell'orecchio per assicurarti che l'audio sia di buona qualità rispetto al riferimento di volume della sintesi vocale di Google. A tal fine, passa dall'ascolto dei file all'eventuale aumento del volume o del bilanciamento e regola il guadagno a voce, se necessario.

Il volume deve essere coerente con il parlato a -16 LUFS (stereo) o -19 LUFS (mono). Tuttavia, se la gamma di frequenza dell'audio è troppo alta (come i richiami di uccelli) o troppo bassa (ad esempio un tuono), l'impostazione di livelli su -16 LUFS (stereo) o -19 LUFS (mono) potrebbe rendere il suono dell'audio incoerente con quello di Google TTS Loudness Reference. In questo caso, il controllo dell'orecchio è particolarmente utile per bilanciare tutto l'audio del programma.