오디오 음량

LUFS (풀스케일 대비 음량 단위)는 여러 장르와 제작 스타일에서 볼륨 정규화를 가능하게 하는 표준입니다. LUFS는 편안한 청취 볼륨에서 사람의 청력으로 인식된 소리 크기를 기반으로 하는 복잡한 알고리즘이며, 오디오 제작자는 사용자가 지속적으로 볼륨을 조절해야 하는 진폭의 변동을 피할 수 있습니다. LUFS는 LKFS (음량, K-가중, 풀스케일 기준)라고도 합니다.

SSML을 사용하여 오디오 파일을 재생할 때 스테레오 오디오 콘텐츠의 평균 소리 크기는 -16 LUFS (음량 단위 풀스케일)여야 하며, 이는 Google 어시스턴트 TTS 출력의 평균 소리 크기와 일치합니다. 이 수준은 Google 어시스턴트와 비교했을 때 음성인식 스피커의 전반적인 볼륨 제어와 가변 다이내믹 레인지를 사용하는 소재의 충분한 헤드룸 간에 적절한 균형을 제공합니다.

모노 오디오 콘텐츠의 경우 평균 음량은 -16 LUFS가 아닌 -19 LUFS여야 합니다. 모노 오디오 콘텐츠의 음량 목표는 스테레오 오디오 콘텐츠와 다릅니다. 모노 오디오 콘텐츠를 스테레오로 변환하면 스테레오 신호의 두 채널에서 모노 오디오 트랙을 복제하여 신호의 에너지가 두 배가 되고 이는 LUFS 측정값이 3.01 음량 단위 (LU)로 증가하는 것과 같습니다. 반대로 스테레오 신호가 단일 스피커에서 재생하기 위해 모노로 변환될 때 모노 신호는 일반적으로 각 채널의 신호를 평균하여 구성되며 이 변환은 LUFS 측정값을 정확히 같은 양인 3.01 LU로 감소시킵니다. 따라서 모노 및 스테레오 콘텐츠의 음량 측정은 직접 비교할 수 없지만 3.01 LUFS로 오프셋해야 합니다.

일부 음량 측정기에는 이러한 편차를 수정할 수 있는 옵션이 있습니다. 예를 들어 ffmpeg (아래 참조)를 사용하는 경우 아래 권장된 대로 dual_mono (또는 dualmono) 옵션을 사용할 수 있습니다. 이러한 옵션과 함께 음량 측정기를 사용 중이고 이 옵션을 사용 설정한 경우 콘텐츠가 스테레오든 모노든 상관없이 음량 타겟은 -16LUFS여야 합니다.

오디오 볼륨을 측정하고 조정하는 두 가지 옵션을 사용하는 것이 좋습니다.

DAW 및 LUFS 측정기 사용

다음 단계에서는 오디오가 -16 LUFS 권장사항을 충족하는지 확인하는 방법을 설명합니다.

  1. 음량이 급증하거나 급감하지 않도록 전체 오디오 재생 시간 동안 모든 오디오를 일관되게 크고 균형 잡힌 수준으로 만듭니다.
  2. 디지털 오디오 워크스테이션 (DAW)과 LUFS 측정기를 설정하여 Google TTS 음량 참조와 비교하여 오디오 크기를 측정합니다.
  3. 오디오의 통합 평균 소리가 약 -16 LUFS(또는 콘텐츠가 모노인 경우 -19 LUFS)가 되도록 오디오의 소리를 측정하고 조정합니다.
  4. 오디오 크기를 Google TTS 음량 참조와 비교하여 오디오를 점검합니다.

DAW 및 LUFS 측정기 설정

다양한 DAW 및 LUFS 측정기를 프리웨어 및 상업용 제품으로 사용할 수 있습니다. 선호하는 DAW 및 LUFS 측정기가 이미 있다면 이를 사용할 수 있습니다. 그 외의 경우 Windows 및 Linux의 경우 Audacity, DAW의 경우 Mac의 경우 Reaper를, LUFS 측정기의 경우 TBProAudio dpMeter II를 사용하는 것이 좋습니다. 다음 섹션에서는 이러한 도구를 사용한다고 가정합니다.

파일 가져오기

  1. DAW를 다운로드하여 설치합니다.
  2. 사용 중인 OS에 맞는 dpMeter II를 다운로드하여 설치합니다. 이 도구는 Audacity 및 Reaper에서 VST(Virtual Studio Technology) 플러그인으로 작동합니다.
  3. Google TTS 음량 참조 오디오 파일을 다운로드합니다. TTS 오디오는 다음과 같이 표시됩니다. '이 문장의 통합된 소리 크기는 약 -16 LUFS입니다.' 이 파일은 측정기의 테스트 오디오 및 이어 체크 참조 역할을 합니다.

Audacity용 dpMeter II 구성 (Windows/Linux)

  1. Audacity에서 Google TTS 음량 참조 오디오 파일을 엽니다.
  2. Effect 탭을 클릭하고 Add/Remove Plug-ins(플러그인 추가/삭제)를 선택하여 dpMeter II 플러그인을 엽니다.
  3. 목록에서 dpMeter2를 찾아 사용 설정, 확인을 차례로 클릭합니다. 이제 dpMeter II 플러그인이 Effect 드롭다운 메뉴에 표시됩니다.
  4. Effect 드롭다운 메뉴에서 dpMeter2를 클릭하여 플러그인을 엽니다. dpMeter II는 기본적으로 RMS 모드 (주황색 색 구성표)로 설정됩니다. LUFS를 측정하려면 모드를 EBU r128 (파란색 색 구성표)으로 변경합니다.

Reaper용 dpMeter II 구성 (Mac)

  1. 삽입 > 미디어 파일....을 클릭하여 Google TTS 음량 참조 오디오를 엽니다.
  2. 오디오 레이어의 왼쪽 창에서 녹색 FX 버튼(그림에서 1번)을 클릭하여 dpMeter II 플러그인을 엽니다. FX 창이 나타납니다.

  3. 목록에서 dpMeter2를 클릭합니다. dpMeter II는 기본적으로 RMS 모드 (주황색 구성표)로 설정됩니다. LUFS를 측정하려면 모드를 EBU r128 (파란색 색 구성표)으로 변경합니다.

음량 측정 및 조정

DAW에 따라 측정기가 다르면 판독값이 약간 다릅니다. Audacity는 Google TTS 음량 참조를 -15.1 LUFS로 측정하지만 Reaper는 -16.0 LUFS의 판독값을 제공합니다. DAW가 Google TTS 음량 참조의 음량을 -16의 +/-2 LUFS 내에서 측정한다면 오디오 음량을 설정하는 데 정상적으로 작동합니다.

음량을 측정하고 조정하는 기본 단계는 다음과 같습니다.

  1. dpMeter II를 사용하여 Google TTS 음량 참조의 볼륨을 측정하여 기준 LUFS 판독값을 설정합니다. DAW가 Google TTS 음량 참조에서 -16 LUFS보다 높거나 낮은 경우 오디오를 DAW의 기준과 일치시킵니다. 예를 들어 Audacity에서 dpMeter II는 -15.1 LUFS의 통합 음량을 측정하므로 프로그램의 새 타겟 음량은 -15.1 LUFS여야 합니다.
  2. 기준을 설정한 후에는 기준 읽기와 일치하도록 오디오를 조정합니다.

Google TTS 음량 참조 측정

dpMeter II에서 녹색 재생 버튼을 클릭하거나 DAW (아래 숫자 4)에서 재생(스페이스바)를 눌러 파일의 소리 크기를 측정합니다.

다음 목록은 dpMeter II에서 사용할 수 있는 주요 기능을 설명합니다.

  1. 모드: LUFS에서 음량을 측정하려면 RMS 대신 EBU로 설정합니다.
  2. Gain Control: 프로그램의 소리 크기를 변경할 준비가 될 때까지 0.0으로 설정해야 합니다.
  3. 통합 음량: 재설정 버튼 (5)을 클릭한 이후 플러그인이 분석한 모든 오디오의 평균 소리를 측정한 값입니다. 각 음량 측정 전에 재설정 버튼 (5)을 클릭하여 현재 선택한 항목의 음량만 측정하고 있는지 확인합니다.
  4. 재생: 오디오 파일의 음량 분석을 시작합니다. (이 버튼은 일부 DAW에는 표시되지 않습니다. DAW에서 기본 재생 버튼 (스페이스바)을 클릭해도 같은 효과가 나타납니다.)
  5. 재설정: 각 소리 크기 측정 사이에 이 버튼을 클릭합니다.
  6. 적용: Google TTS 음량 참조와 일치하도록 프로그램 자료의 소리 크기를 변경할 준비가 되면 이 버튼은 게인 컨트롤 (2)에서 설정한 음량 변경을 적용합니다.

Google TTS 음량 참조와 일치하는 음량

이제 Google TTS 음량 참조 소리를 측정했으므로 오디오의 소리를 측정하고 조정할 수 있습니다.

  1. 오디오 파일을 열고 효과 메뉴에서 dpMeter2를 선택합니다.
  2. Play 버튼을 클릭하고 통합된 음량 값이 오디오 파일의 평균값으로 조정되도록 합니다.
  3. 통합된 소리 크기가 Google TTS 음량 참조와 다른 경우 참조에 맞게 오디오 게인을 조정하세요. 예를 들어 오디오가 -12의 통합 음량에서 측정되면 너무 크므로 게인 컨트롤을 -4db로 설정하고 적용을 클릭하여 게인을 줄여 Google TTS 음량 참조 (-16 LUFS)의 타겟 범위로 가져옵니다. 게인은 LUFS에 불과하므로 목표 음량에 도달하기 위해 게인을 측정하고 조정해야 할 수 있습니다.

ffmpeg 사용

FFmpeg는 미디어 변환을 위한 명령줄 도구가 포함된 미디어 프레임워크입니다. 이 도구에는 음량 정규화를 위한 loudnorm이라는 필터가 포함되어 있습니다. loudnorm을 사용하여 듀얼 패스 모드를 사용하여 적절한 -16 LUFS 음량으로 오디오 파일 버전을 출력할 수 있습니다.

  1. FFmpeg를 다운로드하여 설치합니다.
  2. 설치 디렉터리로 이동한 후 입력 파일의 loudnorm 필터와 함께 FFmpeg를 실행합니다. dual_mono 옵션을 사용 설정해야 합니다.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    이렇게 하면 FFmpeg가 출력 파일을 만들지 않고 미디어 파일의 오디오 값을 측정하도록 지시합니다. 다음과 같이 일련의 값이 표시됩니다.

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    위의 샘플 값은 수신 미디어에 관한 중요한 정보를 나타냅니다. 예를 들어 표시된 Input Integrated 값은 오디오가 너무 크다는 것을 나타냅니다. Output Integrated 값은 -16.0에 훨씬 더 가깝습니다. Input True PeakInput LRA 또는 음량 범위 값이 제공된 천장보다 높고 정규화된 버전에서 감소합니다. 마지막으로 Target Offset는 출력에 사용된 오프셋 게인을 나타냅니다.

  3. loudnorm 필터의 두 번째 패스를 실행하여 1단계의 값을 loudnorm 옵션의 '측정된' 값으로 제공합니다.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    입력 파일의 음량 정규화된 버전이 포함된 output.wav 파일이 생성됩니다.

ffmpeg 음량 정규화 전후의 오디오 파일 예를 통해 도구의 작동 방식을 들어보세요.

오디오 상태 확인하기

귀를 점검하여 Google TTS 음량 참조와 비교했을 때 오디오가 좋은지 확인합니다. 이렇게 하려면 파일 듣기 간에 전환하면서 볼륨이나 밸런스의 점프를 확인하고 필요한 경우 귀로 게인을 조정합니다.

음성의 음량은 -16 LUFS (스테레오) 또는 -19 LUFS (모노)에서 일관되게 들여야 합니다. 하지만 오디오의 주파수 범위가 지나치게 높거나 (예: 천둥) 너무 낮은 경우 (예: 천둥) 수준을 -16 LUFS (스테레오) 또는 -19 LUFS (모노)로 설정하면 이 오디오 사운드가 Google TTS 음량 참조와 일치하지 않을 수 있습니다. 이 경우 이어 체크는 프로그램의 모든 오디오의 균형을 맞추는 데 특히 유용합니다.