音訊的最佳做法

本頁麵包含如何將語音資料提供給 Google 助理 API 的建議。這些指南旨在提高效率與準確性,並加快服務回應時間。

音訊預先處理

建議使用品質良好且位置適當的麥克風,以提供盡可能清晰的音訊。但是,在將音訊傳送至服務之前,對音訊進行雜訊抑制訊號處理通常會降低辨識準確性。服務主要是用來處理吵雜音訊。

為確保最佳成效:

  • 將麥克風放置在盡可能靠近使用者的位置,特別是在有背景噪音時。
  • 避免音訊剪輯。
  • 請勿使用自動增益控制功能 (AGC)。
  • 應停用所有雜訊抑制處理。

理想情況:

  • 建議校正音量,確保輸入信號不會剪輯,且最高語音音訊等級約為 -20 到 -10 dBFS。
  • 裝置應展現大約「平坦」的振奮與頻率特性 (+-3 dB 100 Hz 至 8000 Hz)。
  • 總調和失真率應介於 100 Hz 到 8000 Hz 的 1%,且 90 dB SPL 輸入等級應低於 1%。