Ses Yüksekliği

LUFS (Tam Ölçekli Ses Birimi), birçok tür ve üretim stilinde ses seviyesinin normalleştirilmesine olanak tanıyan bir standarttır. LUFS, rahat bir dinleme ses düzeyinde insan duyma seslerinin algılanan yüksekliğine dayalı karmaşık bir algoritmadır ve ses yapımcılarının, kullanıcıların ses düzeyini sürekli olarak ayarlamasını gerektiren genlik artışlarından kaçınmasına olanak tanır. LUFS, LKFS (Yüksek Yükseklik, K ağırlıklı, Tam Ölçek'e göre) olarak da bilinir

SSML kullanarak ses dosyalarını oynatırken stereo ses içeriği için ortalama ses yüksekliği -16 LUFS (Tam Ölçekli Ses) olmalıdır. Bu değer, Google Asistan TTS çıkışının ortalama ses yüksekliğine karşılık gelir. Bu seviye, Google Asistan'a kıyasla sesle etkinleştirilen hoparlörde genel ses seviyesi kontrolü ve değişken dinamik aralığa sahip malzemeler için geniş boşluklar arasında iyi bir denge sağlar.

mono ses içeriği için ortalama ses yüksekliği -16 LUFS yerine -19 LUFS olmalıdır. Mono ses içeriğinin ses yüksekliği hedefi, stereo ses içeriğinden farklıdır, çünkü mono ses içeriği stereoya dönüştürüldüğünde mono ses parçası bir stereo sinyalin her iki kanalında da kopyalanarak sinyalin enerjisi iki katına çıkar.Bu da 3,01 Ses Düzeyinde (LU) LUFS ölçümünde bir artışa karşılık gelir. Tersine, bir stereo sinyal tek bir hoparlörde çalmak için monoya dönüştürüldüğünde, mono sinyal genellikle her bir kanaldan gelen sinyalin ortalaması alınarak oluşturulur ve bu dönüşüm, LUFS ölçümünü tam olarak aynı miktarda (3, 01 LU) azaltır. Bu nedenle mono ve stereo içerik için ses yüksekliği ölçümleri doğrudan karşılaştırılamaz ancak 3,01 LUFS ile dengelenmesi gerekir.

Bazı ses yüksekliği ölçüm cihazları, bu farklılığı düzeltmeye yönelik seçeneklere sahiptir. Örneğin, ffmpeg kullanıyorsanız (aşağıya bakın) aşağıda önerildiği gibi dual_mono (veya dualmono) seçeneğini kullanabilirsiniz. Böyle bir seçenekle ses seviyesi ölçer kullanıyorsanız ve bu seçeneği etkinleştirdiyseniz ses seviyesi hedefi, içeriğin stereo veya mono olmasından bağımsız olarak -16 LUFS olmalıdır.

Ses yüksekliğini ölçmek ve ayarlamak için iki seçenek öneririz:

DAW ve LUFS ölçeri kullanma

Aşağıdaki adımlarda, sesinizin -16 LUFS önerisini karşıladığından nasıl emin olacağınız açıklanmaktadır:

  1. Yüksek seste ani artışlar veya düşüşler olmayacak şekilde tüm sesleri tutarlı bir şekilde yüksek ve dengeli (eşit) seviyelerde oluşturun.
  2. Ses yüksekliğini Google TTS Ses Referansı ile karşılaştırarak ölçmek için dijital ses iş istasyonu (DAW) ve LUFS ölçümü kurun.
  3. Ses yüksekliğini ölçüp ayarlayarak sesin entegre ortalama ses yüksekliği yaklaşık -16 LUFS (veya içerik mono ise -19 LUFS) olmasını sağlayın.
  4. Ses seviyesini Google TTS Ses Referansı ile karşılaştırarak sesinizi kulaktan kulağa kontrol edin.

DAW ve LUFS ölçümü kurma

Ücretsiz yazılım ve ticari ürün olarak birçok DAW ve LUFS ölçüm cihazı bulunur. Tercih ettiğiniz bir DAW ve LUFS ölçeriniz varsa bunu kullanabilirsiniz. Aksi takdirde, Windows ve Linux için Audacity veya DAW'lar için Mac için Reaper, LUFS ölçümü için TBProAudio dpMeter II'yi öneririz. Aşağıdaki bölümlerde bu araçları kullandığınız varsayılmaktadır.

Dosyaları alma

  1. Bir DAW dosyasını indirin ve yükleyin:
  2. İşletim sisteminiz için dpMeter II'yi indirin ve yükleyin. Bu araç, VST (Virtual Studio Technology) eklentisi olarak hem Audacity hem de Reaper ile birlikte kullanılabilir.
  3. Google TTS Ses Seviyesi Referansı ses dosyasını indirin. TTS sesi şöyle yazar: "Bu cümlenin entegre ses gürültüsü yaklaşık -16 LUFS". Bu dosya, ölçüm cihazı için test sesi ve kulak kontrolü referansı olarak işlev görür.

Audacity için dpMeter II'yi yapılandırma (Windows/Linux)

  1. Audacity'de Google TTS Ses Referansı ses dosyasını açın.
  2. Efekt sekmesini tıklayıp Eklenti Ekle/Kaldır'ı seçerek dpMeter II eklentisini açın.
  3. Listede dpMeter2'yi bulun, Etkinleştir'i, ardından Tamam'ı tıklayın. dpMeter II eklentisi artık Efekt açılır menüsünde görünür.
  4. Eklentiyi açmak için Efekt açılır menüsünde dpMeter2'yi tıklayın. dpMeter II, varsayılan olarak RMS moduna (turuncu renk şeması) ayarlanır. LUFS'yi ölçmek için modu EBU r128 (mavi renk şeması) olarak değiştirin.

Reaper için dpMeter II'yi yapılandırma (Mac)

  1. Ekle > Medya dosyası.... seçeneğini tıklayarak Google TTS Ses Referansı sesini açın.
  2. Ses katmanının sol bölmesindeki yeşil FX düğmesini (şekilde 1 rakamı) tıklayarak dpMeter II eklentisini açın. Bir FX penceresi açılır.

  3. Listede dpMeter2'yi tıklayın. dpMeter II varsayılan olarak RMS moduna (turuncu renk şeması) ayarlanır. LUFS'yi ölçmek için modu EBU r128 (mavi renk şeması) olarak değiştirin.

Ses seviyesini ölçme ve ayarlama

Farklı DAW'lardaki farklı metre değerleri, biraz daha farklı değerler verir. Audacity, Google TTS Ses Referansı'nı diğer DAW'lerden biraz daha yüksek sesle (-15,1 LUFS) ölçerken Reaper, -16,0 LUFS değerini verir. DAW'nız Google TTS Ses Seviyesi Referansı'nın yüksekliğini -16'lık +/-2 LUFS içinde ölçtüğü sürece, ses seviyenizi ayarlamak için sorunsuz bir şekilde çalışır.

Ses seviyesini ölçmek ve ayarlamak için temel adımlar şunlardır:

  1. Temel bir LUFS okuması oluşturmak üzere Google TTS Ses Seviyesi Referansı'nın yüksekliğini ölçmek için dpMeter II'yi kullanın. DAW'nız Google TTS Ses Seviyesi Referansı için -16 LUFS'den daha yüksek veya daha düşük bir değer ölçüyorsa sesi, DAW değerinizin referans değeriyle eşleştirin. Örneğin, Audacity'de dpMeter II, -15,1 LUFS'lik entegre bir ses düzeyini ölçer. Bu nedenle, programınız için yeni hedef ses yüksekliği -15,1 LUFS olmalıdır.
  2. Referans değer oluşturduktan sonra sesinizi, referans değere uyacak şekilde ayarlayın.

Google TTS Ses Düzeyi Referansını Ölçme

Dosyanın yüksekliğini ölçmek için dpMeter II'deki yeşil oynat düğmesini veya DAW yazılımınızdaki oynat düğmesini (boşluk çubuğu) (aşağıda 4 numara) tıklayın.

Aşağıdaki listede, dpMeter II'de kullanabileceğiniz başlıca özellikler açıklanmaktadır:

  1. Mod: LUFS'de gürültüyü ölçmek için RMS yerine EBU olarak ayarlayın
  2. Kazanç Kontrolü: Programınızın yüksekliğini değiştirmeye hazır olana kadar bu ayarın 0,0 olarak ayarlandığından emin olun.
  3. Entegre Ses Yüksekliği: Bu, sıfırlama düğmesi (5) tıklandığında eklentinin analiz ettiği tüm seslerin ortalama ses yüksekliğinin ölçümüdür. Yalnızca mevcut seçimin yüksekliğini ölçtüğünüzden emin olmak için her ses yüksekliği ölçümünden önce sıfırlama düğmesini (5) tıklayın.
  4. Çal: Bu seçenek, ses dosyasının ses yüksekliği analizini başlatır. (Bu düğme tüm DAWS'lerde görünmez. DAW yazılımınızdaki ana oynat düğmesini (boşluk çubuğu) tıkladığınızda da aynı etki meydana gelecektir.)
  5. Sıfırla: Her ses yüksekliği ölçümü arasında bu düğmeyi tıklayın.
  6. Uygula: Program materyalinizin yüksekliğini Google TTS Ses Referansı ile eşleşecek şekilde değiştirmeye hazır olduğunuzda bu düğme, Kazanç Kontrolü (2) tarafından ayarlanan ses yüksekliği değişikliğini uygular.

Ses yüksekliği, Google TTS Ses Düzeyi Referansı ile eşleştirilir

Google TTS Ses Seviyesi Referansı ses düzeyini ölçtüğünüze göre, sesinizin yüksekliğini ölçebilir ve ayarlayabilirsiniz:

  1. Ses dosyanızı açın ve Efekt menüsünden dpMeter2'yi seçin.
  2. Oynat düğmesini tıklayın ve entegre ses yüksekliği değerinin ses dosyanız için ortalama bir değere ayarlanmasını bekleyin.
  3. Entegre ses yüksekliği, Google TTS Ses Düzeyi Referansı'ndan farklıysa ses kazancını referansla eşleşecek şekilde ayarlayın. Örneğin, sesiniz -12 entegre yüksek sesle ölçüm yapıyorsa ses çok gürültülüdür. Bu nedenle Kazanç Kontrolü'nü -4 db'ye ayarlayıp Uygula'yı tıklayarak kazancı azaltın ve Google TTS Ses Yüksekliği Referansı'nın (-16 LUFS) hedef aralığına getirin. Kazanç, yalnızca LUFS'ye yaklaşık bir değer verdiğinden, hedef ses yüksekliğine ulaşmak için kazancı ölçmeniz ve ayarlamanız gerekebilir.

FFmpeg kullanma

FFmpeg, medya dönüşümü için bir komut satırı aracına sahip bir medya çerçevesidir. Araç, ses yüksekliği normalleştirmesi için loudnorm adlı bir filtre içerir. Çift geçiş modunu kullanarak ses dosyanızın bir sürümünü -16 LUFS ses yüksekliğinde oluşturmak için soundnorm'u kullanabilirsiniz.

  1. FFmpeg'i indirip yükleyin.
  2. Yükleme dizinine gidin ve giriş dosyanızdaki soundnorm filtresiyle FFmpeg'i çalıştırın. dual_mono seçeneğini etkinleştirdiğinizden emin olun.

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    Bu işlem, FFmpeg'e, çıkış dosyası oluşturmadan medya dosyanızın ses değerlerini ölçme talimatı verir. Aşağıdaki gibi sunulan bir dizi değer alırsınız:

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    Yukarıdaki örnek değerler, gelen medya hakkındaki önemli bilgileri gösterir. Örneğin, gösterilen Input Integrated değeri sesin çok yüksek olduğunu gösterir. Output Integrated değeri -16,0'a çok daha yakındır. Hem Input True Peak hem de Input LRA ya da ses yüksekliği aralığı, sağladığımız tavan değerlerinden yüksektir ve normalleştirilmiş sürümde azaltılır. Son olarak, Target Offset, çıkışta kullanılan ofset kazancını temsil eder.

  3. 1. adımdaki değerleri Lolunorm seçeneklerinde "ölçülen" değerler olarak sağlayarak Londrarm filtresini ikinci bir geçiş olarak çalıştırın.

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    Giriş dosyanızın gürültü normalleştirilmiş bir sürümünü içeren output.wav dosyası oluşturulur.

Aracın nasıl çalıştığını dinlemek için ffmpeg ses normalleştirmesinden önceki ve sonraki ses dosyası örneklerini dinleyin.

Önce

Sonra

Sesinizi kulak kontrolünden geçirin

Sesinizin Google TTS Ses Referansı'na kıyasla iyi olduğundan emin olmak için kulak kontrolü yapın. Bunun için dosyaları dinleme arasında geçiş yapın, ses düzeyinde veya dengede herhangi bir artış olup olmadığına bakın ve gerekirse ses kazancını kulaktan ayarlayın.

-16 LUFS (stereo) veya -19 LUFS (mono) değerinde söylenen kelimeler için ses düzeyi tutarlı olmalıdır. Bununla birlikte, sesinizin frekans aralığı aşırı yüksek (kuş sesleri gibi) veya aşırı düşükse (gök gürültüsü gibi) seviyelerin -16 LUFS (stereo) veya -19 LUFS (mono) olarak ayarlanması bu sesin Google TTS Ses Seviyesi Referansı ile tutarsız olmasına neden olabilir. Bu durumda, özellikle programınızdaki tüm seslerin dengelenmesinde kulak kontrolü faydalı olur.