ความดังของเสียง

LUFS (หน่วยความดังที่สัมพันธ์กับขนาดเต็ม) เป็นมาตรฐานที่ช่วยให้ปรับระดับเสียงให้เป็นปกติในแนวเพลงและสไตล์เวอร์ชันที่ใช้งานจริงหลายประเภท LUFS เป็นอัลกอริทึมที่ซับซ้อนซึ่งพิจารณาจากความดังที่มนุษย์ได้ยินที่รับรู้ในระดับการฟังที่สบาย และช่วยให้ผู้ผลิตเสียงหลีกเลี่ยงการกระโดดในแอมพลิชันที่ทำให้ผู้ใช้ต้องปรับระดับเสียงอย่างต่อเนื่อง LUFS เรียกอีกอย่างว่า LKFS (ความดัง การระบุน้ำหนัก K เมื่อเทียบกับ Full Scale)

เมื่อเล่นไฟล์เสียงโดยใช้ SSML ความดังเฉลี่ยควรเป็น -16 LUFS (Loudness Unit Full Scale) สำหรับเนื้อหาเสียงสเตอริโอซึ่งตรงกับความดังเฉลี่ยของเอาต์พุต Google Assistant TTS เสียงในระดับนี้ช่วยให้การควบคุมระดับเสียงโดยรวมในลำโพงที่เปิดใช้งานด้วยเสียงและช่องว่างที่เพียงพอสำหรับวัสดุที่มีช่วงไดนามิกแบบแปรผันได้เมื่อเทียบกับ Google Assistant

สำหรับเนื้อหาเสียงโมโน ความดังเฉลี่ยควรเป็น -19 LUFS แทนที่จะเป็น -16 LUFS เป้าหมายความดังของเนื้อหาเสียงแบบโมโนแตกต่างจากเนื้อหาเสียงสเตอริโอ เพราะเมื่อมีการแปลงเนื้อหาเสียงแบบโมโนเป็นสเตอริโอด้วยการสร้างแทร็กเสียงแบบโมโนซ้ำในช่องสัญญาณสเตอริโอทั้ง 2 ช่อง จะเป็นการเพิ่มพลังงานของสัญญาณเป็น 2 เท่า ซึ่งสอดคล้องกับการวัด LUFS ที่ 3.01 หน่วยความดัง (LU) ที่เพิ่มขึ้น ในทางกลับกัน เมื่อแปลงสัญญาณสเตอริโอเป็นโมโนสำหรับเล่นในลำโพงตัวเดียว โดยทั่วไปแล้วสัญญาณโมโนจะสร้างโดยหาค่าเฉลี่ยของสัญญาณจากแต่ละช่อง และการเปลี่ยนรูปแบบนั้นจะลดการวัด LUFS ด้วยจำนวนที่เท่ากันคือ 3.01 LU ดังนั้นการวัดความดังสำหรับเนื้อหาแบบโมโนและสเตอริโอจึงเปรียบเทียบกันโดยตรงไม่ได้ แต่ต้องปรับค่าความดังด้วย 3.01 LUFS

เครื่องวัดความดังบางประเภทมีตัวเลือกในการแก้ไขความไม่สอดคล้องนี้ เช่น หากคุณใช้ ffmpeg (ดูด้านล่าง) คุณจะใช้ตัวเลือก dual_mono (หรือ dualmono) ได้ตามที่แนะนำด้านล่าง หากคุณใช้เครื่องวัดความดังกับตัวเลือกดังกล่าว และเปิดใช้ตัวเลือกนี้แล้ว เป้าหมายความดังควรเป็น -16 LUFS ไม่ว่าเนื้อหาจะเป็นสเตอริโอหรือโมโนก็ตาม

เราขอแนะนำ 2 ตัวเลือกในการวัดและปรับความดังของเสียง ดังนี้

การใช้เครื่องวัด DAW และ LUFS

ขั้นตอนต่อไปนี้อธิบายวิธีตรวจสอบว่าเสียงเป็นไปตามคำแนะนำ -16 LUFS

  1. สร้างเสียงทั้งหมดที่ความดังและมีความสมดุล (แบบเท่ากัน) อย่างสม่ำเสมอตลอดระยะเวลาของเสียง เพื่อให้ความดังไม่เพิ่มขึ้นหรือลดลง
  2. ตั้งค่าเวิร์กสเตชันเสียงดิจิทัล (DAW) และมิเตอร์ LUFS เพื่อวัดความดังของเสียงโดยเปรียบเทียบกับการอ้างอิงความดังของ Google TTS
  3. วัดและปรับความดังของเสียงเพื่อให้มีความดังเฉลี่ยรวมอยู่ที่ประมาณ -16 LUFS (หรือ -19 LUFS หากเนื้อหาเป็นโมโน)
  4. ตรวจสอบเสียงโดยเปรียบเทียบความดังกับการอ้างอิงความดังของ Google TTS

ตั้งค่าเครื่องวัด DAW และ LUFS

มีตัวตรวจสอบ DAW และ LUFS หลายรายการในรูปแบบฟรีแวร์และผลิตภัณฑ์เชิงพาณิชย์ หากคุณมีเครื่องวัด DAW และ LUFS ที่ต้องการอยู่แล้ว ก็ใช้ได้เลย หรือไม่เช่นนั้น เราขอแนะนำให้ใช้ Audacity สำหรับ Windows และ Linux หรือ Reaper สำหรับ Mac สำหรับ DAWs และ TBProAudio dpMeter II สำหรับเครื่องวัด LUFS ส่วนต่อไปนี้จะถือว่าคุณใช้เครื่องมือเหล่านี้

รับไฟล์

  1. ดาวน์โหลดและติดตั้ง DAW ดังนี้
    • สำหรับ Windows หรือ Linux: Audacity
    • สำหรับ Mac: Reaper
  2. ดาวน์โหลดและติดตั้ง dpMeter II สำหรับระบบปฏิบัติการของคุณ เครื่องมือนี้ใช้งานได้กับทั้ง Audacity และ Reaper ในรูปแบบปลั๊กอิน VST (เทคโนโลยีสตูดิโอเสมือน)
  3. ดาวน์โหลดการอ้างอิงความดังของ Google TTS เสียง TTS จะระบุว่า "ความดังในตัวของประโยคนี้คือ -16 LUFS" ไฟล์นี้ทำหน้าที่เป็นเสียงทดสอบสำหรับมิเตอร์และข้อมูลอ้างอิงการตรวจสอบหู

กำหนดค่า dpMeter II สำหรับ Audacity (Windows/Linux)

  1. เปิดไฟล์เสียงการอ้างอิงความดังของ Google TTS ใน Audacity
  2. เปิดปลั๊กอิน dpMeter II โดยคลิกแท็บเอฟเฟกต์ แล้วเลือกเพิ่ม/นำปลั๊กอินออก
  3. ค้นหา dpMeter2 ในรายการ คลิกเปิดใช้ แล้วคลิกตกลง ตอนนี้ปลั๊กอิน dpMeter II จะปรากฏในเมนูแบบเลื่อนลงเอฟเฟกต์
  4. คลิก dpMeter2 จากเมนูแบบเลื่อนลงเอฟเฟกต์เพื่อเปิดปลั๊กอิน dpMeter II มีค่าเริ่มต้นเป็นโหมด RMS (รูปแบบสีส้ม) เปลี่ยนโหมดเป็น EBU r128 (รูปแบบสีน้ำเงิน) เพื่อวัด LUFS

กำหนดค่า dpMeter II สำหรับ Reaper (Mac)

  1. เปิดเสียงการอ้างอิงความดังของ Google TTS โดยคลิก แทรก > ไฟล์สื่อ....
  2. เปิดปลั๊กอิน dpMeter II โดยคลิกปุ่ม FX สีเขียว (หมายเลข 1 ในรูป) ในหน้าต่างด้านซ้ายของเลเยอร์เสียง หน้าต่าง FX จะปรากฏขึ้น

  3. คลิก dpMeter2 ในรายการ dpMeter II มีค่าเริ่มต้นเป็นโหมด RMS (รูปแบบสีส้ม) เปลี่ยนโหมดเป็น EBU r128 (รูปแบบสีสีน้ำเงิน) เพื่อวัด LUFS

การวัดและปรับความดัง

ค่ามิเตอร์ที่ต่างกันใน DAW แต่ละค่าจะให้ค่าที่ต่างกันเล็กน้อย Audacity มักจะวัดการอ้างอิงความดังของ Google TTS ได้ดังกว่า DAW อื่นๆ เล็กน้อยที่ -15.1 LUFS ส่วน Reaper ให้การอ่านค่า -16.0 LUFS ตราบใดที่ DAW วัดความดังของการอ้างอิงความดังของ Google TTS ภายใน +/-2 LUFS ของ -16 ก็ควรใช้ตั้งค่าความดังของเสียงได้อย่างเหมาะสม

ขั้นตอนพื้นฐานในการวัดและปรับความดังมีดังนี้

  1. ใช้ dpMeter II เพื่อวัดความดังของความดังของ Google TTS ข้อมูลอ้างอิงเพื่อสร้างการอ่าน LUFS แบบพื้นฐาน หาก DAW วัด LUFS สูงกว่า -16 สำหรับการอ้างอิงความดังของ Google TTS ให้จับคู่เสียงกับเกณฑ์พื้นฐานของ DAW เช่น ใน Audacity dpMeter II จะวัดความดังแบบรวมเป็น -15.1 LUFS ดังนั้นความดังเป้าหมายใหม่สำหรับโปรแกรมของคุณจึงควรเป็น -15.1 LUFS
  2. หลังจากสร้างข้อมูลพื้นฐานแล้ว ให้ปรับเสียงให้ตรงกับการอ่านค่าพื้นฐาน

การวัดการอ้างอิงความดังของ Google TTS

คลิกปุ่มเล่นสีเขียวใน dpMeter II หรือกดเล่น (สเปซบาร์) ใน DAW (หมายเลข 4 ด้านล่าง) เพื่อวัดความดังของไฟล์

รายการต่อไปนี้อธิบายฟีเจอร์หลักๆ ที่คุณอาจใช้ใน dpMeter II

  1. โหมด: ตั้งค่าเป็น EBU (แทน RMS) เพื่อวัดความดังใน LUFS
  2. การควบคุมค่าเกน: ตรวจสอบว่าค่านี้ตั้งเป็น 0.0 จนกว่าคุณจะพร้อมเปลี่ยนระดับความดังของโปรแกรม
  3. ความดังในตัว: นี่คือการวัดความดังเฉลี่ยของเสียงทั้งหมดที่ปลั๊กอินวิเคราะห์ตั้งแต่มีการคลิกปุ่มรีเซ็ต (5) คลิกปุ่มรีเซ็ต (5) ก่อนการวัดความดังแต่ละครั้ง เพื่อให้แน่ใจว่าคุณกำลังวัดเฉพาะความดังของเสียงที่เลือกไว้เท่านั้น
  4. เล่น: จะเริ่มการวิเคราะห์ความดังของไฟล์เสียง (ปุ่มนี้จะไม่ปรากฏใน DAW ทั้งหมด การคลิกปุ่มเล่นหลัก (แป้นเว้นวรรค) ใน DAW ของคุณควรจะมีผลเช่นเดียวกัน)
  5. รีเซ็ต: คลิกปุ่มนี้ระหว่างการวัดความดังแต่ละครั้ง
  6. ใช้: เมื่อคุณพร้อมที่จะเปลี่ยนความดังของเนื้อหาในโปรแกรม ให้ตรงกับการอ้างอิงความดังของ Google TTS ปุ่มนี้จะใช้การเปลี่ยนแปลงความดัง ที่กำหนดโดยการควบคุมค่าเกน (2)

การจับคู่ความดังกับการอ้างอิงความดังของ Google TTS

ตอนนี้คุณวัดความดังของการอ้างอิงความดังของ Google TTS แล้ว คุณจะวัดและปรับความดังของเสียงได้โดยทำดังนี้

  1. เปิดไฟล์เสียงของคุณและคลิกเลือก dpMeter2 จากเมนูเอฟเฟกต์
  2. คลิกปุ่มเล่น แล้วปล่อยให้ค่าความดังในตัวเป็นค่าเฉลี่ยสำหรับไฟล์เสียง
  3. หากความดังในตัวแตกต่างจากข้อมูลอ้างอิงด้านความดังของ Google TTS ให้ปรับอัตราขยายของเสียงให้ตรงกับข้อมูลอ้างอิง ตัวอย่างเช่น ถ้าเสียงวัดที่ความดังแบบรวมที่ -12 แสดงว่าดังเกินไป ให้ลดอัตราการขยายเสียงโดยตั้งค่า Gain Control เป็น -4db แล้วคลิกใช้ เพื่อให้เสียงอยู่ภายในช่วงเป้าหมายของการอ้างอิงความดังของ Google TTS (-16 LUFS) คุณอาจต้องวัดและปรับค่าเกนเพื่อให้ได้ความดังเป้าหมายเพราะ จะได้ค่า LUFS โดยประมาณเท่านั้น

การใช้ ffmpeg

FFmpeg เป็นเฟรมเวิร์กสื่อที่มีเครื่องมือบรรทัดคำสั่งสำหรับการแปลงสื่อ เครื่องมือนี้มีตัวกรองชื่อ loudnorm สำหรับการปรับความดังให้เป็นมาตรฐาน คุณสามารถใช้ Loudnorm เพื่อสร้างไฟล์เสียงเวอร์ชันที่มีระดับความดัง -16 LUFS ที่เหมาะสมโดยใช้โหมด Dual-Pass

  1. ดาวน์โหลดและติดตั้ง FFmpeg
  2. ไปที่ไดเรกทอรีการติดตั้งและเรียกใช้ FFmpeg ด้วยตัวกรอง loudnorm ในไฟล์อินพุต อย่าลืมเปิดใช้ตัวเลือก dual_mono

    ./ffmpeg -i /path/to/input.wav \
        -af loudnorm=I=-16:dual_mono=true:TP=-1.5:LRA=11:print_format=summary \
        -f null -
    

    การดำเนินการนี้จะบอกให้ FFmpeg วัดค่าเสียงของไฟล์สื่อโดยไม่ต้องสร้างไฟล์เอาต์พุต คุณจะได้รับชุดค่าที่แสดงดังต่อไปนี้

    Input Integrated:    -27.2 LUFS
    Input True Peak:     -14.4 dBTP
    Input LRA:             0.1 LU
    Input Threshold:     -37.7 LUFS
    
    Output Integrated:   -15.5 LUFS
    Output True Peak:     -2.7 dBTP
    Output LRA:            0.0 LU
    Output Threshold:    -26.2 LUFS
    
    Normalization Type:   Dynamic
    Target Offset:        -0.5 LU
    

    ค่าตัวอย่างด้านบนระบุข้อมูลสำคัญเกี่ยวกับสื่อขาเข้า เช่น ค่า Input Integrated ที่แสดงบ่งบอกว่าเสียงดังเกินไป ค่า Output Integrated จะใกล้เคียงกับ -16.0 อย่างมาก ค่าของทั้ง Input True Peak และ Input LRA หรือช่วงความดังจะสูงกว่าเพดานที่เราระบุไว้และจะลดลงในเวอร์ชันปกติ สุดท้าย Target Offset แทนค่าออฟเซ็ตที่ใช้ในเอาต์พุต

  3. เรียกใช้ตัวกรอง loudnorm ที่ 2 โดยใส่ค่าจากขั้นตอนที่ 1 เป็นค่าที่ "วัดแล้ว" ในตัวเลือก loudnorm

    ./ffmpeg -i /path/to/input.wav -af loudnorm=I=-16:TP=-1.5:LRA=11:measured_I=-27.2:measured_TP=-14.4:measured_LRA=0.1:measured_thresh=-37.7:offset=-0.5:linear=true:print_format=summary output.wav
    

    ไฟล์ output.wav สร้างขึ้นโดยมีเวอร์ชันความดังปกติของไฟล์อินพุต

ฟังตัวอย่างไฟล์เสียงต่อไปนี้ก่อนและหลังการปรับความดังของ ffmpeg ให้เป็นมาตรฐาน เพื่อฟังวิธีการทำงานของเครื่องมือ

ก่อน

หลัง

ตรวจสอบเสียงคุณได้ยิน

ตรวจสอบหูเพื่อให้แน่ใจว่าเสียงดีเมื่อเทียบกับการอ้างอิงความดังของ Google TTS วิธีการคือ ให้สลับระหว่างฟังไฟล์แล้วสังเกตระดับเสียงหรือความสมดุล เสียงที่พุ่งขึ้น แล้วปรับช่วงที่ได้รับทางหูหากจำเป็น

ความดังควรมีความสม่ำเสมอสำหรับคำพูดที่ค่า -16 LUFS (สเตอริโอ) หรือ -19 LUFS (โมโน) อย่างไรก็ตาม หากช่วงความถี่ของเสียงสูงเกินไป (เช่น เสียงนกร้อง) หรือต่ำมากเกินไป (เช่น เสียงฟ้าร้อง) การตั้งค่าระดับเป็น -16 LUFS (สเตอริโอ) หรือ -19 LUFS (โมโน) อาจทำให้เสียงนี้ไม่สอดคล้องกับการอ้างอิงความดังของ Google TTS ในกรณีนี้ การตรวจหูมีประโยชน์อย่างยิ่งในการสร้างสมดุลให้กับเสียงทั้งหมดในโปรแกรมของคุณ